이 리포트는 AI 동영상 분석 기술의 발전 현황과 트렌드를 살펴보고, 한국과 미국의 주요 스타트업 사례 및 투자 동향을 분석합니다. 특히, 거대언어모델(LLM)과 소형언어모델(sLLM)을 결합한 최신 동향과 각 기업의 기술적 성과 및 시장 반응을 조명합니다. 트웰브랩스 등 한국의 주요 스타트업과 Answer AI, 스케일 AI 등의 미국 스타트업의 활동과 투자 현황을 다루며, AI 동영상 분석 기술이 여러 산업 분야에서 어떻게 활용되는지를 살펴봅니다. 아울러 브라이틱스 비주얼서치와 마렝고 등의 기술적 성과도 소개됩니다.
AI 동영상 분석 기술은 주로 동영상 내의 움직임, 사물, 소리, 화면의 텍스트와 음성 등 다양한 정보를 추출하고, 이를 바탕으로 동영상을 이해하고 분석하는 기술입니다. 대표적인 예로 트웰브랩스는 2021년 창업 직후 영상을 이해하는 초거대 AI 모델을 개발하였으며, 이를 통해 영상 데이터베이스에서 구체적인 검색 결과를 제시하는 기능을 선보였습니다. 예를 들어, 고든 램지가 버거를 만드는 영상에서 식재료를 나열해 달라 하면 마요네즈, 상추, 토마토, 버터 등을 답해줍니다. 나아가, 동영상을 한 문장으로 설명해 달라는 요청에도 여러 문장으로 상세히 설명할 수 있습니다.
AI 동영상 분석 기술은 여러 산업 분야에서 유용하게 활용됩니다. 삼성SDS의 브라이틱스 비주얼서치 솔루션은 얼굴 인식, 콘텐츠 관리, 시스템 관리, AI 디지털 클립 생성 등 다양한 동영상 분석 서비스를 제공합니다. 예를 들어, 방송된 하이라이트 영상을 자동으로 편집하여 3~5분 길이의 클립 영상을 생성하고, 이를 통해 클립 제작 시간과 비용을 절감하는 동시에 추가 수익을 창출할 수 있습니다. 또한, 인물, 객체, 상황 등을 상세히 검색할 수 있고, 원하는 시점으로도 검색이 가능하도록 지원합니다.
AI 동영상 분석 기술이 발전함에 따라 여러 가지 기술적 과제도 함께 대두되고 있습니다. 예를 들어, 다양한 데이터 형태를 처리하고, 이를 이해해야 하는 AI 모델의 복잡성이 증가하고 있는 상황입니다. 트웰브랩스는 이러한 과제를 해결하기 위해 초거대 AI 영상 언어 생성 모델 '페가수스'와 멀티모달 영상이해 모델 '마렝고'를 출시했습니다. 이 모델들은 구글의 제미나이 1.5프로, 오픈AI의 GPT-4V와 비교해 최대 43%가량 높은 성능을 기록하였습니다. 이러한 기술적 성과를 통해 동영상의 맥락적 이해와 다양한 요소 간의 복잡한 관계 파악 등이 가능한 분석 결과를 제공하고 있습니다.
트웰브랩스는 2021년 한국의 20대 청년 5명이 설립한 AI 스타트업으로 영상 검색 및 분석 기술을 전문으로 개발하고 있습니다. 이 회사는 멀티모달 신경망을 사용해 영상 내 음성 언어, 시각 정보, 등장인물 등의 데이터를 분석하여 구체적인 검색 결과를 제공합니다. 예를 들어, 다양한 브랜드의 자동차를 소개하는 영상에서 특정 브랜드를 나열하면 현대자동차와 기아 등을 검색 결과로 제시할 수 있습니다. 2022년에는 CB인사이트의 '세계 100대 AI 기업'에 선정되었고, 글로벌 투자업계로부터 높은 관심을 받았습니다. 특히, 2022년 초 실리콘밸리 벤처캐피탈 인덱스벤처스 등으로부터 1700만 달러(약 220억원)의 시드 투자를 유치하며 주목받기 시작했습니다. 이후 삼성넥스트, 한국투자파트너스와 함께 엔비디아로부터 투자를 받았으며, 이는 엔비디아가 한국 스타트업에 직접 투자한 최초의 사례입니다. 트웰브랩스는 AI 영상 언어 생성 모델 '페가수스(Pegasus-1)'와 멀티모달 영상 이해 모델 '마렝고(Marengo 2.6)'를 개발하였고, 이 모델들의 성능은 구글의 제미나이 1.5프로와 오픈AI의 GPT-4V보다 최대 43% 우수한 성능을 보였습니다.
삼성SDS의 브라이틱스 비주얼서치는 AI 영상 분석 기술을 활용하여 다양한 서비스를 제공합니다. 글로벌 시장조사기관 Forrester의 리포트에도 등재된 이 솔루션은 얼굴인식, 인물 분석, 객체 분석 등 다양한 API 서비스를 통해 영상을 쉽고 간편하게 검색 및 편집할 수 있도록 지원합니다. 또한, NIST에서 실시한 얼굴인식 시험평가에서 글로벌 6위, 국내 1위를 달성하는 등의 성과를 거두었습니다. 브라이틱스 비주얼서치는 방송 후 하이라이트 영상을 자동으로 생성하여 클립 제작 시간과 비용을 절감하고 추가 광고 수익 창출이 가능하도록 합니다. 이외에도 인물, 객체, 상황 등을 상세 검색할 수 있는 기능과 함께 AI 영상 검증 기능도 제공하고 있습니다.
파일러는 인공지능(AI) 기반 디지털 솔루션 스타트업으로, 유해 콘텐츠 필터링 및 브랜드 보호 솔루션을 제공합니다. 2023년 세계 최고 인공지능 학회인 CVPR에 논문이 등재되었고, ICCV에서 수상하는 등 영상 AI 분야에서 기술력을 인정받았습니다. 파일러는 105억 원 규모의 시리즈A 투자 유치에 성공하였으며, 현대투자파트너스, 쿼드벤처스, 한세예스24파트너스 등이 이번 라운드에 참여했습니다. 파일러의 대표 솔루션인 '에이드(AiD)'는 동영상 콘텐츠의 맥락을 분석하여 성인용, 증오 유발, 부정 행위, 사이비 종교 등 부적절한 콘텐츠가 브랜드에 노출되지 않도록 막아줍니다. 이는 브랜드 호감도와 구매 의향 감소를 방지하는 데 큰 역할을 합니다. 파일러는 앞으로도 자체 모델 개발 역량을 강화하고 더 많은 주 고객을 확보할 계획입니다.
이 스타트업은 AI 동영상 분석 기술을 활용하여 사용자에게 정보를 제공하는 플랫폼을 개발했습니다. 최신 거대언어모델(LLM)과 소형언어모델(sLLM)을 결합한 기술을 통해 보다 정확하고 빠른 분석 결과를 제공합니다. 투자 유치 현황과 기술적 성과에 관한 상세한 데이터는 'bigo-news-N2376434822994573935-0-kor' 문서에서 확인할 수 있습니다.
포바이포는 AI를 이용해 동영상을 분석하고, 주요 인사이트를 추출하는 기술을 보유한 스타트업입니다. 특히, 소형언어모델을 활용해 리소스 소모를 줄이면서도 높은 정확도의 분석 결과를 제공하고 있습니다. 이 회사의 투자 동향과 시장 반응에 대한 정보는 'bigo-news-N3739408239997293085-0-kor' 문서에 자세히 나와 있습니다.
스케일 AI는 대규모 데이터를 처리하고 분석하는 능력이 뛰어난 AI 동영상 분석 기업입니다. 이 회사는 거대언어모델을 적용하여 복잡한 동영상 데이터에서 유의미한 패턴을 추출하는 데 주력하고 있습니다. 해당 스타트업의 주요 기술적 성과와 투자 현황은 'go-public-web-kor-N6217025912852259065-0-0' 문서를 참조하면 됩니다.
연례 AI 현황 보고서 2023에 따르면, 거대언어모델(LLM)이 AI 커뮤니티에서 매우 중요한 역할을 하고 있습니다. 특히 GPT-4는 성능과 기능 면에서 새로운 표준을 세우며, 그 우위는 규모와 독점 아키텍처의 혁신적인 통합 그리고 인간 피드백을 통한 강화 학습의 전략적인 사용에 기인합니다. 이로 인해 GPT-4는 다른 모델을 능가하여 맞춤형 아키텍처의 잠재력을 검증할 수 있습니다.
소형언어모델(sLLM)도 중요한 역할을 합니다. 이 모델들은 복잡한 작업을 처리하는 데 소요되는 자원을 최적화하며, 다양한 애플리케이션에서 활용됩니다. 특히, 실시간 내비게이션 시스템, 날씨 예측, 자율주행차, 그리고 음악 생성 등 여러 도메인에서 AI 기반 솔루션을 제공하여 중요한 성과를 이끌어내고 있습니다. 내비게이션 시스템의 경우, 실시간 변화를 예측하여 보다 안전하고 효율적인 여행을 보장합니다.
거대언어모델과 소형언어모델의 결합은 많은 이점을 제공합니다. 이 결합은 서로의 장점을 극대화하여 보다 효율적이고 강력한 AI 시스템을 만들어냅니다. 예를 들어, 고성능 컴퓨팅 리소스를 효율적으로 이용하여 복잡한 문제를 해결하는 데 도움을 줍니다. 이러한 결합의 예로는 GPT-4와 다양한 소형언어모델을 활용한 복합 시스템을 들 수 있습니다. 이 시스템은 AI의 성능과 기능을 극대화하는 동시에 안전성과 효율성을 보장합니다. 이러한 기술적 성과는 여러 산업 분야에서 실질적인 효용을 제공하며, 혁신적인 솔루션을 만들어냅니다.
최근의 투자 사례 분석 결과, 한국의 AI 동영상 분석 스타트업인 트웰브랩스가 주목받고 있습니다. 트웰브랩스는 2021년 창업 이후, 동영상 데이터를 이해하고 분석하는 초거대 AI 모델을 개발하여 큰 성과를 보였습니다. 특히, 이 회사는 동영상 속 특정 구간을 상세하게 검색할 수 있는 기술을 보유하고 있으며, 이는 동영상 내의 움직임, 사물, 소리, 화면의 텍스트, 음성 등을 모두 추출하고 이해하여 맥락적으로 분석하는 능력을 갖추고 있습니다. 최근에는 엔비디아와 인텔 등에서 1000만 달러(약 135억 원)의 투자를 유치하여 더욱 주목받고 있습니다.
AI 동영상 분석 기술에 대한 투자 동향을 살펴보면, 특히 글로벌 빅테크 및 투자 기업들이 AI 유니콘 기업에 대한 관심을 지속적으로 확대하고 있음을 알 수 있습니다. 미국의 CB인사이트가 선정한 ‘인공지능(AI) 100’에 한국의 트웰브랩스와 리벨리온이 포함되었으며, 이는 이들 기업의 독보적인 AI 기술력이 세계적으로 인정받고 있음을 보여줍니다. 이는 AI 반도체와 같은 첨단 기술에 대한 투자 역시 증대되고 있음을 시사합니다. 이와 같은 투자 동향은 AI 동영상 분석 기술의 발전과 상용화를 더욱 가속화할 것으로 전망됩니다.
트웰브랩스의 사례를 통해 기업 가치를 평가해 보면, 이 회사는 창업 이후 꾸준히 기술력을 발전시키며 시장의 주목을 받고 있습니다. 트웰브랩스는 영상 검색 및 이해를 위한 초거대 AI 모델 ‘페가수스’를 비롯한 다양한 모델을 개발하여, 구글의 제미나이 1.5프로, 오픈 AI의 GPT-4V와 비교해 최대 43%의 성능 우위를 기록하였습니다. 이러한 기술력과 시장에서의 반응은 트웰브랩스의 기업 가치를 높이는 주요 요인으로 작용하고 있습니다. 또한, CB인사이트의 ‘인공지능(AI) 100’에 3년 연속 선정된 점도 기업 가치 평가에서 중요한 요소로 작용할 것입니다.
트웰브랩스는 2021년에 창업된 스타트업으로, 영상 이해를 위한 초거대 AI 모델을 개발하였습니다. 예를 들어, 고든 램지가 버거를 만드는 영상에서 마요네즈, 상추, 토마토, 버터 등의 식재료를 나열할 수 있으며, 영상의 특정 구간까지 구체화된 검색 결과를 제공합니다. 이 모델은 움직임, 사물, 소리, 화면의 텍스트, 음성 등 다양한 정보를 추출하여 동영상을 맥락적으로 이해할 수 있습니다. 트웰브랩스는 3년 연속 CB인사이트의 'AI 100'에 선정되었으며, 지난해 초거대 AI 영상 언어 생성 모델 '페가수스'와 멀티모달 영상 이해 모델 '마렝고'를 출시하여 구글의 제미나이 1.5프로, 오픈AI의 GPT-4V 등과 비교하여 최대 43% 높은 성능을 기록했습니다.
트웰브랩스와 같은 AI 회사들이 개발하는 모델들은 많은 컴퓨팅 자원과 전력을 소모합니다. 이는 데이터 센터의 냉각 필요성 증가와 탄소 배출량 증가로 이어질 수 있습니다. 따라서 이러한 AI 기술의 발전은 환경적 지속 가능성을 고려한 방식으로 이루어져야 합니다. 이를 위해 친환경 에너지 사용 확대와 같은 대안적인 조치가 필요합니다.
AI 동영상 분석 기술은 앞으로 더욱 발전할 것으로 보입니다. 특히, 트웰브랩스와 같은 스타트업의 성장이 주목되는데, 이들은 계속해서 기술적 성과를 내고 있으며, 투자자들로부터 주목받고 있습니다. 예를 들어, 트웰브랩스는 2023년에 엔비디아와 인텔 등으로부터 1000만 달러의 투자를 유치하였습니다. 이러한 투자 및 기술적 발전은 AI 동영상 분석 기술의 미래를 밝게 하고 있으며, 이 기술은 다양한 산업 분야에서 더 널리 사용될 것입니다.
이 리포트에서는 AI 동영상 분석 기술의 주요 발전과 활용 방안을 심층 분석하였습니다. 트웰브랩스, 파일러, 포바이포 및 삼성SDS의 브라이틱스 비주얼서치와 같은 주요 한국 스타트업들이 AI 기술을 활용한 혁신적인 솔루션을 어떻게 구현하고 있는지 조명하였으며, 미국의 Answer AI, 스케일 AI 등도 다루었습니다. 이들 기업은 거대언어모델(LLM)과 소형언어모델(sLLM)의 결합을 통해 높은 성능의 AI 동영상 분석 기술을 선보이고 있습니다. 리포트는 기술이 발전함에 따라 AI 모델들이 직면할 환경적 고려사항과 사회적 영향도 언급하였으며, 앞으로의 기술 발전 방향과 향후 성장 가능성까지 전망합니다. 최첨단 기술과 시장의 반응을 종합적으로 분석한 이 리포트를 통해 독자들은 AI 동영상 분석 기술의 현재와 미래를 명확히 이해할 수 있을 것입니다.
트웰브랩스는 영상 검색과 분류, 생성에 특화된 AI 모델을 개발하는 기업으로, AI 기술을 활용한 영상 내 특정 구간 검색 등 혁신적인 기술력을 보유하고 있습니다. 최근 엔비디아와 인텔로부터 투자를 유치하며 주목받고 있습니다.
삼성SDS는 브라이틱스 비주얼서치(AI 영상 분석 솔루션)를 통해 얼굴 인식, 행동 분석 등 다양한 서비스를 제공합니다. 이 기술은 NIST 평가에서 글로벌 6위, 국내 1위를 기록하며 높은 평가를 받고 있습니다.
파일러는 동영상 콘텐츠의 맥락을 분석하여 부적절한 콘텐츠로부터 브랜드를 보호하는 AI 솔루션을 운영하고 있습니다. 최근 105억원 규모의 시리즈A 투자 유치에 성공하며 기술력을 인정받고 있습니다.
포바이포는 데이터 크기를 줄이면서도 화질을 개선하는 AI 솔루션을 제공하는 기업으로, 효율적인 동영상 전송을 가능케 해 동영상 콘텐츠 증가로 인한 전력 소모 문제를 해결하고 있습니다.
스케일 AI는 텍스트, 이미지, 비디오 등의 데이터에 레이블을 정확히 지정하여 AI 모델 학습에 필요한 고품질 데이터를 제공하는 기업입니다. 주요 글로벌 기업들로부터 투자받으며 빠르게 성장하고 있습니다.