현재 시점인 2025년 05월 05일을 기준으로, 넷플릭스의 추천 시스템은 과거의 협업 필터링 기법에서 시작하여 최근의 Foundation Model 도입과 함께 진화하고 있다. 추천 시스템의 기본 원리는 사용자의 행동 데이터를 분석하여 맞춤형 콘텐츠를 제공하는 데 중점을 두고 있으며, 이에는 두 가지 주요 방식이 포함된다. 첫째, 협업 필터링은 사용자의 명시적 및 암시적 피드백을 기반으로 비슷한 취향을 갖는 사용자나 아이템을 추천하는 방식을采用하며, 메모리 기반 방식과 모델 기반 방식으로 나눌 수 있다. 둘째, 콘텐츠 기반 필터링은 사용자가 선호하는 콘텐츠의 속성을 분석하여 유사한 콘텐츠를 추천하며, 이는 사용자 개인의 취향을 더욱 명확히 반영할 수 있는 장점을 가지고 있다.
넷플릭스는 기존의 개별 모델 한계를 극복하고, Foundation Model을 도입하여 장기적인 사용자 선호를 이해하고 다양한 추천 시나리오에 유연하게 대응할 수 있도록 하고 있다. 이 모델은 데이터 기반 접근 방식을 통해 복잡성을 줄이고, 여러 추천 기능을 통합하는 데 중점을 두었다. 특히, LLM과 ChatGPT의 활용은 사용자가 자연어로 문의하는 방식으로 추천할 수 있는 혁신을 제공하며, 이는 기존의 추천 시스템과 비교하여 더욱 개인화된 사용자 경험을 가능하게 하고 있다.
OTT 플랫폼 간의 AI 추천 트렌드를 비교해보면, 유튜브는 사용자 행동에 기반한 추천 알고리즘을 활용하여 실시간으로 개인화된 콘텐츠를 제공하는 반면, 넷플릭스는 사용자 프로필을 기반으로 심층적인 개인화 경험을 지원하고 있다. 이러한 접근은 사용자의 참여를 통해 추천 시스템의 정교함을 높이고 있으며, 사용자의 선호도에 따른 다양한 콘텐츠 제공이 이루어지고 있다.
넷플릭스는 또한 하이브리드 알고리즘을 결합하여 추천의 정확도를 더욱 높이고 있다. 고도화된 추천 시스템은 사용자 데이터를 바탕으로 기존의 단순 메타데이터에서 벗어나 보다 넓은 범위의 복합 데이터를 통합함으로써, 추천의 품질을 한층 강화하고 개인화 경험을 지속적으로 발전시킬 것이다.
협업 필터링(Collaborative Filtering)은 사용자의 행동 데이터를 기반으로 개인의 선호도를 예측하고 맞춤형 추천을 제공하는 기술입니다. 이 기술은 사용자의 명시적 피드백(예: 별점)이나 암시적 피드백(예: 조회수, 클릭수)을 분석하여 비슷한 취향을 가진 사용자나 유사한 특성을 가진 아이템을 추천하는 방식을 활용합니다. 협업 필터링은 크게 메모리 기반 방식과 모델 기반 방식으로 나눌 수 있습니다.
메모리 기반 협업 필터링은 기존 사용자의 행동 데이터를 활용하여 실시간으로 추천을 수행합니다. 이 방식에는 두 가지 주요 방법이 있습니다: 사용자 기반(User-Based) 협업 필터링과 아이템 기반(Item-Based) 협업 필터링입니다. 사용자 기반 협업 필터링은 비슷한 취향을 가진 사용자 그룹을 찾아내어 그 그룹의 선호도를 기반으로 추천하는 방식입니다. 이러한 방식은 유사한 사용자들이 비슷한 선호도를 가질 가능성이 높다는 원리를 바탕으로 합니다. 반면, 아이템 기반 협업 필터링은 사용자가 과거에 선호했던 아이템과 유사한 아이템을 찾아 추천합니다. 이 방식은 특정 아이템을 좋아하는 사용자가 유사한 아이템도 선호할 가능성이 크다는 점에 기반하고 있습니다.
모델 기반 협업 필터링은 머신러닝 기법을 활용하여 사용자와 아이템의 특성을 학습한 후, 새로운 사용자나 아이템에 대한 추천을 수행하는 방식입니다. 대표적인 모델 기반 기법으로는 잠재 요인 모델(Latent Factor Model)이 있습니다. 이 방법은 사용자와 아이템을 저차원 공간(latent space)에 매핑하여 유사도를 계산하는 과정을 포함하며, 행렬 분해(Matrix Factorization) 기법이 주를 이룹니다. 사실상, 이러한 방식은 사용자와 아이템의 상호작용 데이터를 행렬로 표현하고 이를 분해하여 잠재적 요인을 추출하는 과정으로 이루어져 있어 추천 시스템의 성능을 크게 향상시킵니다.
협업 필터링의 대표적인 문제 중 하나는 '콜드 스타트 문제(Cold Start Problem)'입니다. 이는 신규 사용자 또는 신규 아이템에 대한 데이터가 부족할 경우, 추천이 어려워지는 현상을 의미합니다. 또한, 데이터 희소성(Data Sparsity) 문제 또한 존재해, 적은 수의 평가나 리뷰가 있을 때 추천의 신뢰도가 저하될 수 있습니다. 이러한 문제를 해결하기 위해 많은 연구자들은 딥러닝과 강화 학습을 결합한 방법에 주목하고 있으며, 협업 필터링의 한계를 극복하기 위한 여러 방식이 모색되고 있습니다.
콘텐츠 기반 필터링(Content-Based Filtering)은 사용자가 이전에 선호한 콘텐츠의 정보를 기반으로 유사한 콘텐츠를 추천하는 방식입니다. 이 방식은 사용자가 선택한 아이템의 특정 속성(예: 장르, 출연자, 주제 등)을 분석하고, 사용자에게 적합한 다른 아이템을 추천하는 원리에 기반합니다.
특히 콘텐츠 기반 필터링은 사용자의 행동 데이터뿐만 아니라 아이템의 특성 데이터에도 크게 의존합니다. 예를 들어, 넷플릭스와 같은 플랫폼에서는 영화 또는 TV 프로그램의 메타데이터(제목, 장르, 공개 연도 등의 정보)를 활용하여 해당 콘텐츠와 유사한 다른 콘텐츠를 추천합니다. 이러한 과정은 유사도 측정 방법에 따라 달라지며, 대표적으로 벡터 공간 모델(Vector Space Model)이나TF-IDF(Term Frequency-Inverse Document Frequency)와 같은 방법론이 사용됩니다.
콘텐츠 기반 필터링의 장점은 사용자가 선호하는 특정 속성을 반영하여 추천할 수 있기 때문에, 일반적으론 사용자에게 보다 개인화된 경험을 제공할 수 있다는 것입니다. 그러나 단점도 있는데, 사용자가 선호하지 않는 다양한 아이템에 대한 추천이 제한될 수 있어, 이는 추천의 다양성을 저해할 수 있습니다. 또한, 콘텐츠 기반 필터링은 새로운 콘텐츠에 대한 사용자 반응을 반영하는 데 시간이 걸릴 수 있기 때문에, 적절한 추천을 제공하기 위한 추가적인 데이터 또는 방법론이 필요합니다.
넷플릭스는 이전에 수많은 개별 추천 모델을 운영하여 사용자에게 최적화된 콘텐츠를 제공하려고 하였습니다. 이러한 모델들은 'Continue Watching(이어서 보기)', '오늘의 추천' 등 특정 목적에 맞게 각각 독립적으로 설계되어 있었으며, 이는 각 모델이 서로 다른 데이터와 학습 경로를 따르면서도 서로의 혁신과 발전을 공유하기 어려운 구조였습니다. 이는 추천 시스템의 유지 관리와 기술적 진전을 더 어렵게 만들었습니다.
특히 이 개별 모델들은 최근 시청 이력과 같은 단기적 데이터에 의존함으로써, 사용자 장기적인 선호를 파악하는 데 한계가 있었습니다. 이로 인해 사용자에게 개인화된 경험을 제공하는 데 있어서도 제약이 있었습니다. 넷플릭스는 이러한 단점을 극복하기 위해 ‘Foundation Model’을 도입하게 됩니다.
Foundation Model은 넷플릭스 추천 시스템의 새로운 혁신으로, 여러 개별 모델의 한계를 넘어서는 것을 목표로 합니다. 이 모델은 방대한 사용자 데이터를 기반으로 하여 장기적인 사용자 선호를 이해하고, 다양한 추천 시나리오에 유연하게 적용될 수 있도록 설계되었습니다. 이는 자연어 처리(NLP) 분야에서의 대규모 언어 모델(LLM)의 활용 방안과 유사한 접근법이라 할 수 있습니다.
이 모델은 크게 다음과 같은 특징을 가집니다. 첫째, 데이터를 중심으로 한 접근 방식으로, 개별 모델 간 복잡성과 유지 비용을 줄이고, 데이터 기반으로 직접 학습하여 다양한 기능을 통합합니다. 둘째, 디지털 토큰화 방식을 통해 사용자 행동을 요약하고, 다양한 정보를 담은 사용자 행동 데이터를 관리할 수 있게 설계되었습니다. 이를 통해 장기적인 사용자 행동의 패턴을 효과적으로 학습할 수 있습니다.
셋째, 기계 학습의 여러 기법을 결합하여 데이터의 희소성 문제를 완화하고, 'Cold Start'와 같은 문제를 해결하기 위한 전략도 포함되어 있습니다. 이러한 개선된 설계 원칙은 넷플릭스가 추천의 정확도를 높이고, 사용자 경험을 개선하는 길잡이 역할을 하게 됩니다.
유튜브와 넷플릭스는 서로 다른 방식으로 사용자 맞춤형 추천 시스템을 운영하고 있습니다. 유튜브는 주로 그들의 추천 알고리즘을 통해 개인화된 콘텐츠를 제공하며, 이는 사용자 시청 기록, 검색 활동, 그리고 구독 정보 등을 바탕으로 작동합니다. 이러한 추천 시스템은 사용자의 취향을 분석하여 비슷한 콘텐츠를 추천하는 데 초점을 맞추고 있습니다. 이번 분석에서도 유튜브의 추천 시스템의 핵심 구성 요소로는 다음과 같은 단계가 있습니다. 첫째, 추천 후보 생성 단계에서 사용자로부터 수집된 데이터를 분석하여 추천할 수 있는 후보 목록을 대량으로 생성합니다. 둘째, 생성된 후보 목록을 기반으로 사용자에게 가장 적합한 콘텐츠를 랭킹 채점하는 단계가 있습니다. 마지막으로, 선택된 콘텐츠 중에서 필터링을 통해 품질이 낮거나 부적절한 콘텐츠를 제외하고 최종 추천 리스트를 제공하는 방식입니다. 반면, 넷플릭스는 각 사용자의 개인 프로필을 기본으로 추천 시스템을 운영하여 더욱 깊이 있는 개인화된 경험을 제공합니다. 넷플릭스의 추천 시스템은 각각의 사용자 프로필에 맞는 콘텐츠를 추천하며, 사용자 시청 기록과 취향을 분석하여 맞춤형 추천 콘텐츠 리스트를 생성합니다. 또한, ‘나를 위한 추천’ 기능을 통해 사용자의 관심사에 맞는 콘텐츠를 선별하여 표시합니다. 이 시스템은 시청 기록에 기반하여 사용자의 선호하는 장르, 배우, 감독을 포함한 다양한 요소를 고려하여 추천합니다.
넷플릭스의 추천 시스템은 사용자 참여를 기반으로 점점 더 정교해지고 있습니다. 사용자가 콘텐츠에 대해 남기는 평가는 알고리즘이 작동하는 방식을 개선하는 데 crucial한 역할을 합니다. 별점 평가는 물론, ‘좋아요’와 ‘싫어요’ 피드백을 통해 넷플릭스는 사용자 취향의 변화를 빠르게 파악하고 이에 기반한 새로운 콘텐츠를 추천할 수 있습니다. 이러한 개인 맞춤화는 사용자들을 플랫폼에 더 오랫동안 머물게 하는 결과로 이어지며, 이로 인해 넷플릭스의 높은 고객 재방문율이 보장되고 있습니다.
OTT 플랫폼의 AI 큐레이션 기법은 각 서비스의 특징과 비즈니스 모델에 따라 상이합니다. 예를 들어, Amazon Prime Video는 사용자의 시청 패턴을 기반으로 맞춤형 추천을 제공하며, 이는 주로 사용자 데이터 수집과 분석을 통해 이루어집니다. Amazon의 경우, 사용자가 구매하거나 리뷰한 상품 데이터를 추가적으로 분석하여 사용자의 관심사를 더 잘 반영한 콘텐츠를 제안하는 경향이 있습니다. 또한, Purple IPTV와 같은 핸드헬드 플랫폼들은 도입된 AI 추천 시스템을 통해 사용자에게 더욱 맞춤화된 경험을 제공하고 있습니다. 이들은 머신 러닝 알고리즘을 이용해 사용자의 시청 기록, 검색 쿼리, 그리고 각 콘텐츠에 소비한 시간을 분석하여 개인 맞춤형 콘텐츠를 추천합니다. 예를 들어, 사용자가 특정 장르의 콘텐츠를 자주 시청하는 경우, 해당 장르의 새로운 콘텐츠나 관련 영화를 지속적으로 추천합니다. AI를 활용한 큐레이션 기법들은 개인화된 사용자 경험을 향상시키는데 중요한 역할을 수행하고 있으며, 이 과정에서 데이터 분석 기술의 발전은 필수적입니다. 이러한 AI 기반 추천 시스템은 끊임없이 사용자의 행동을 학습하여 시간이 지남에 따라 더 나은 추천을 생성할 수 있는 잠재력을 가지고 있습니다. 하지만 이러한 기술은 사용자의 데이터 프라이버시 문제와도 연결되어 있어, 사용자의 신뢰를 얻기 위해서는 데이터 보호를 위한 투명한 정책이 필수적입니다.
LLM(대규모 언어 모델)의 도입은 추천 시스템의 혁신을 이끌고 있습니다. 사용자가 자신의 감정이나 상황을 자연어로 설명하면, LLM은 이를 해석하여 적합한 콘텐츠를 추천합니다. 예를 들어, 사용자가 '혼자 조용히 보기 좋은 영화 없을까?'라고 입력하면, LLM은 사용자의 기분과 맥락을 분석하여 감성적인 영화 리스트를 제공할 뿐만 아니라, 추천하는 이유까지 설명해 줍니다. 이를 통해 추천의 수용성이 높아지고, 사용자 경험 역시 향상됩니다.
또한 LLM은 단순한 메타데이터에 의존하지 않고 영화의 전반적인 내용을 이해하여 신작 영화 및 다양한 장르에 대한 추천 가능성을 높여줍니다. 이 방식은 특히 콜드 스타트 문제를 해결하는 데 도움을 줄 수 있습니다. 기존의 추천 시스템보다 더 자연스럽고 사용자 맞춤형 추천을 가능하게 하여 사용자와의 신뢰를 구축하는 데 기여합니다.
넷플릭스는 OpenAI와의 협업을 통해 ChatGPT를 추천 시스템에 접목시키고 있습니다. 이를 통해 사용자에게 보다 직관적이고 맞춤화된 콘텐츠 탐색 경험을 제공하고자 합니다. 현재 뉴질랜드와 호주에서 아이폰 사용자를 대상으로 테스트 중이며, 긍정적인 피드백이 있을 경우 글로벌 롤아웃이 예정되어 있습니다.
이 기능은 사용자가 '강렬한 여성 캐릭터가 등장하는 드라마 시리즈를 보고 싶어.'라는 식으로 자연어로 요청하면, 시스템이 이를 이해하고 해당하는 콘텐츠를 추천합니다. 이러한 시스템 도입으로 인해 사용자는 사실 기반의 검색이 아닌 대화형 방식으로 콘텐츠를 탐색할 수 있게 되며, 이는 사용자 경험을 크게 개선하는 결과를 초래합니다.
추천 트렌드는 하이브리드 모델로 진화하고 있습니다. 하이브리드 모델은 여러 가지 추천 알고리즘—예를 들어, 협업 필터링과 콘텐츠 기반 필터링—을 결합하여 더 높은 정확도를 제공합니다. 이는 사용자 데이터가 없음에도 초기 추천을 통해 사용자와의 신뢰를 구축할 수 있으며, 이후에는 시청 기록에 기반한 개인화 추천을 가능하게 합니다.
이러한 접근은 순환적으로 사용자 경험을 개선하며, LLM과 같은 최신 기술을 접목시킴으로써 추천의 품질을 더욱 높일 수 있습니다. 사용자 피드백을 통해 알고리즘을 지속적으로 개선하고, 사용자가 선호하는 콘텐츠를 더욱 명확하게 파악하는 데 도움을 줍니다. 이는 결국 사용자 이탈을 방지하고, 플랫폼의 재방문율을 높이는 데 기여하는 중요한 전략으로 자리잡고 있습니다.
2025년 05월 05일 현재, 넷플릭스는 과거의 협업 필터링 기법과 개별 목적 모델의 한계를 극복하고, Foundation Model을 통해 모든 추천 시스템을 통합하여 사용자 맞춤형 경험을 확장하는 혁신적인 단계를 밟고 있다. 이는 목표 지향적인 알고리즘에서 벗어나 LLM 기반의 통합 모델을 도입함으로써 얻게 되는 풍부한 데이터를 통해 추천의 정확도와 효율성을 대폭 향상시키는 과정을 포함한다. 유튜브와 같은 다른 OTT 플랫폼이 아직은 목적별 분리 모델을 유지하고 있는 점에 비추어 볼 때, 넷플릭스는 사용자 개인의 취향 변화에 실시간으로 adapt하면서도 멀티모달 데이터를 융합하여 더욱 정교한 개인화 경험을 제공하는 방향으로 나아가고 있다.
따라서, 기업들은 이러한 개인화 모델의 발전 추세를 반영하여 하이브리드 추천 아키텍처를 구축해야 하며, 사용자 프라이버시를 고려한 투명한 AI 라벨링 시스템을 도입함으로써 사용자 신뢰를 구축할 필요가 있다. 이는 단순히 추천의 정확도를 높이는 것에 그치지 않고, 오랜 기간에 걸쳐 사용자의 플랫폼에 대한 충성도를 제고하며 재방문율을 높이는 데 기여할 것이다. 앞으로의 OTT 시장에서 개인화와 추천 시스템의 발전을 통해 제공될 새로운 사용자 경험은 매우 기대된다.
출처 문서