구글 딥마인드의 새로운 비디오 생성 AI 모델인 '비오 2'는 비디오 생성 기술에서 중요한 진전을 이루었습니다. 4K 해상도와 향상된 지속 시간을 통해 이전 모델 '비오'와 경쟁 모델인 오픈AI의 '소라'를 넘어서는 성능을 보여 줍니다. 이 리포트는 비오 2의 주요 기능과 기술적 발전을 강조하며, 특히 고해상도의 텍스트 및 이미지 기반 비디오 생성 능력과 물리적 움직임의 정교한 재현 능력을 분석합니다. 또한, 비오 2는 시장에서 AI 비디오 생성 기술의 새로운 기준을 제시하며, 소라 모델에 비해 벤치마크 테스트에서 높은 사용자의 선호도를 얻고 있습니다. 비오 2는 AI 앱 개발 플랫폼인 버텍스 AI를 통해 사용자에게 제공되며, 앞으로 유튜브 쇼츠 등 다양한 서비스로 확장될 계획입니다.
구글 딥마인드가 2025년 1월 16일에 발표한 비오2는 AI 비디오 생성 모델인 비오의 후속 모델입니다. 비오는 2024년 5월 구글 I/O 개발자 컨퍼런스에서 처음 공개되었으며, AI 비디오 생성 AI 모델 중 오픈AI의 소라 모델에 대한 경쟁력이 높은 것으로 평가받고 있습니다.
비오2는 4K 해상도로 2분 이상의 영상을 생성할 수 있으며, 프롬프트를 통해 높은 해상도의 영상을 제작할 수 있도록 설계되었습니다. 비오2는 20초 분량의 1080p 해상도 영상을 생성하는 오픈AI의 소라 모델에 비해 뛰어난 성능을 보여줍니다. 또한, 비오는 배경 흐림이나 초점 조절과 같은 촬영 기법을 지원하고 있으며, 유체 역학과 빛의 속성을 사실적으로 모델링할 수 있는 성능을 가지고 있습니다. 비오2는 AI 앱 개발 플랫폼인 버텍스 AI를 통해 제공될 예정이며, 차후에 유튜브 쇼츠와 기타 서비스로 확장될 계획임이 밝혀졌습니다.
비오2의 주요 경쟁 모델인 오픈AI의 소라 모델은 상대적으로 낮은 성능을 기록하고 있으며, 사용자들 사이에서는 기대에 미치지 못하는 평가를 받고 있습니다. 비오2는 유체 역학과 물체 상호 작용을 정교하게 표현할 수 있는 강점을 보이며, 실제로 벤치마크 테스트에서 소라 모델에 비해 높은 선호도를 기록하였습니다. 시장에서는 비오2가 AI 비디오 생성 기술의 새로운 기준을 제시함으로써, 콘텐츠 제작 과정에서 혁신적인 가능성을 보여줄 것으로 기대하고 있습니다.
구글 비오 2는 최대 4K(4096 x 2160) 해상도로 2분 이상의 동영상을 제작할 수 있습니다. 이는 오픈AI의 소라와 비교하여 해상도는 4배, 지속 시간은 6배 이상 향상된 성능을 보여줍니다. 이러한 고해상도의 비디오 출력은 시청자에게 더 생생하고 정교한 시각적 경험을 제공합니다.
비오 2는 텍스트 프롬프트 또는 이미지를 기반으로 영상을 생성할 수 있는 능력을 가지고 있습니다. 사용자가 제공하는 세부 지침을 정확하게 반영하여 다양한 창작 도구로 활용될 수 있습니다. 예를 들어, 사용자가 '눈이 내리는 도시 풍경'이라는 텍스트를 입력하면, 비오 2는 해당 조건을 반영한 영상을 생성할 수 있습니다.
비오 2는 물리적 법칙을 정확히 재현할 수 있는 알고리즘을 사용하여, 유체 동역학이나 빛의 특성을 활용해 자연스러운 움직임을(예: 물체 이동 속도, 중력의 영향 등) 표현합니다. 이러한 기능을 통해 사용자는 가상 카메라의 세밀한 조작을 할 수 있으며, 다양한 각도와 렌즈 효과를 구현하여 더 사실적인 영상을 제작할 수 있습니다.
구글 딥마인드가 공개한 비디오 생성 AI '비오 2'는 최대 4K 해상도를 지원하며, 이는 이전 모델인 '비오'가 지원했던 1080p 해상도에 비해 크게 향상된 성능입니다. 비오 2는 기본적으로 8초의 클립을 생성할 수 있지만, 사용자가 요청할 경우 2분 이상으로 연장할 수 있습니다. 반면, 오픈AI의 '소라'는 출력 해상도가 여전히 1080p로 제한되어 있으며, 클립의 길이도 20초로 설정되어 있습니다. 이러한 차이는 비오 2가 장면을 표현하는 데 있어 더 많은 가능성을 제공함을 나타냅니다.
비오 2는 물리적 특성을 정확하게 재현하는 데 있어 강점을 보입니다. 특히, 물의 파동 표현에서 뛰어난 정확도를 자랑하며, 물체의 움직임에 따른 환경 변화도 잘 표현합니다. 반면, 소라는 복잡한 물리 현상, 특히 체조 선수들의 세밀한 움직임을 현실적으로 생성하는 데 어려움을 겪고 있으며, 자연스럽지 않은 움직임이 발견되기도 합니다. 이러한 점에서 비오 2는 물리적 정확성을 기준으로 더 나은 성능을 보여줍니다.
구글 딥마인드는 최근 벤치마크 결과를 통해 비오 2가 인간 평가자들 사이에서 59%의 선호도를 기록한 반면, 소라의 선호도는 27%에 불과하다고 밝혔습니다. 비오 2는 프롬프트에 명시된 내용을 정확하게 반영하는 경향이 있으며, 복잡한 장면에서도 시간적 일관성을 유지하는 데 보다 강력한 모습을 보이고 있습니다. 소라는 이러한 점에서 비오 2에 비해 낮은 평가를 받았으며, 프롬프트의 복잡성에 따라 결과물의 편차가 커질 수 있는 단점이 있습니다.
구글 딥마인드가 최근 발표한 비디오 생성 AI인 비오 2는 이전 모델인 비오에 비해 많은 기술적 발전을 이뤘으나 여전히 다음과 같은 기술적 한계가 존재합니다. 첫째, 비오 2는 고 성능의 동영상 생성이 가능하나 고해상도 작업을 위한 높은 컴퓨팅 리소스가 요구됩니다. 둘째, 윤리적 논의 부족으로 AI 콘텐츠의 저작권 문제 및 창작자 대체 우려가 있습니다. 특히 다양한 예술가와 콘텐츠 제작자들이 자신의 작품이 동의 없이 AI 모델 훈련에 사용되는 것에 대해 우려를 표하고 있습니다. 셋째, 비오 2는 다양한 물리적 특성을 이해하고 재현하는 데 중점을 두고 있으나 실제 환경의 물리법칙에 대한 완벽한 이해에는 여전히 한계가 있습니다.
비오 2는 AI 비디오 생성 기술의 진화의 일환으로, 4K 해상도를 지원하는 최초의 모델이 되었습니다. 이는 오픈AI의 소라가 여전히 1080p 해상도에 제한되어 있다는 점과 대조적입니다. 비오 2는 물리적 특성을 더욱 정교하게 표현할 수 있으며, 사용자 요청에 기반한 카메라 제어 기능이 크게 향상되었습니다. 또한, 딥마인드는 비오 2의 출력물에 신스ID 워터마크를 적용하여 정치적 허위 정보의 사용을 어렵게 만들었습니다. 이러한 진화는 단순한 기술적 진전을 넘어, AI가 영상 제작 전문가의 보조자로서 기능할 가능성을 시사합니다.
비오 2의 향후 발전 방향은 고해상도 영상 생성의 지속적인 연구와 물리적 이해 향상에 중점을 두고 있습니다. 비오 2는 영화 제작, 광고 및 교육 분야 등 다양한 산업에서 응용될 수 있는 가능성을 지니고 있으며, 특히 고품질의 광고 영상 제작에 적합할 것으로 예상됩니다. 그러나, 높은 연산비용과 사용 접근성 제한 등 해결해야 할 제약사항도 존재합니다. 이와 함께 비오 2의 기술이 창작지원 도구로 자리 잡기 위한 윤리적 이슈를 해결하는 것이 중요할 것입니다.
구글 딥마인드의 비오 2는 AI 비디오 생성 기술에서 혁신적인 발전을 이루며, 시장에서 새로운 기준을 제시합니다. 고해상도와 긴 지속 시간, 정교한 물리적 재현은 비오 2의 주요한 장점으로, 이는 오픈AI의 '소라'에 비해 우수한 성능으로 나타납니다. 특히, 벤치마크에서 높은 선호도를 보여 다양한 분야에서의 활용 가능성을 보여주지만, 고해상도 영상 작업에 따른 높은 컴퓨팅 요구와 윤리적 문제, 저작권 관련 이슈 등 해결해야 할 과제도 남아 있습니다. 이러한 기술적 한계를 해결한다면, 비오 2는 AI 기반 비디오 생성 분야에서 핵심 도구로 자리 잡아 콘텐츠 제작의 혁신을 이끌 것입니다. 향후 비오 2는 영화 및 광고 제작, 교육 분야 등에서 큰 응용 가능성을 가지고 있으며, 고품질 광고 영상 제작에도 적합할 것으로 예상됩니다.
출처 문서