미스트랄 Large 2: 최첨단 AI 모델의 등장과 그 평가

일일 보고서 2024년 08월 16일

목차

요약
미스트랄 Large 2 개요
라지 2의 성능 분석
경쟁 모델 비교
라지 2의 한계 및 시장 반응
미스트랄의 향후 계획 및 전망
결론

1. 요약

이 리포트는 프랑스 기반 AI 스타트업 미스트랄 AI가 출시한 최첨단 AI 모델 '라지 2'에 대한 성능과 평가를 다룹니다. 라지 2는 코드 생성, 수학, 추론 성능에서 오픈AI와 메타의 최신 모델과 동등하거나 뛰어난 성능을 보이며, 1230억 개의 매개변수를 가지고 있습니다. 다국어와 80개의 코딩 언어를 지원하며, 주요 벤치마크에서 우수한 성과를 기록했습니다. 그러나 멀티모달 기능의 부재와 상업적 유료 라이선스 정책이 단점으로 지적되었습니다. 시장 반응은 긍정적이며, 미스트랄의 기술 발전 속도와 성장 가능성에 주목하고 있습니다.

2. 미스트랄 Large 2 개요

2-1. 미스트랄 AI 소개

미스트랄(Mistral)은 프랑스에 본사를 둔 인공지능(AI) 스타트업으로, 제너럴 캐털리스트(General Catalyst)가 주도하는 시리즈 B 펀딩 라운드에서 6억 4천만 달러를 모금하여 60억 달러의 평가를 받았습니다. 미스트랄은 인공지능 분야에 비교적 최근에 진입했지만, 빠르게 최첨단 AI 모델을 출시하고 제공합니다.

2-2. 라지 2의 주요 특징

미스트랄의 라지 2(Large 2)는 코드 생성, 수학 및 추론 측면에서 오픈AI와 메타의 최신 모델과 동등한 성능을 자랑합니다. 라지 2는 총 1230억 개의 매개변수를 갖추고 있으며, 12만8000 토큰의 컨텍스트 창을 제공해 한 번의 프롬프트로 많은 데이터를 처리할 수 있습니다. 또한 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어 및 한국어를 포함한 12개 언어와 80개의 코딩 언어를 지원합니다. 라지 2는 근접, 높은 추론 능력, 고급 함수 호출 및 검색 기능들을 제공합니다.

2-3. 매개변수와 성능

라지 2는 1230억 개의 매개변수를 가지고 있습니다. 성능 측면에서 라지 2는 코드 생성 및 수학 성능에서 메타의 라마(Llama) 3.1 405B 모델을 능가하며, 매개변수는 3분의 1 이하로 효율적입니다. 라지 2는 코드 생성 정확도를 평가하는 멀티플-E(MultiPL-E) 벤치마크와 수학 중심 벤치마크인 GSM8K 및 매스 인스트럭트(Math Instruct)에서 GPT-4o에 이어 2위를 차지했습니다. 또한, 함수 호출 벤치마크에서는 GPT-4o, 클로드 3.5 소네트, 클로드 3 오퍼스를 제치고 1위를 차지했습니다.

3. 라지 2의 성능 분석

3-1. 코드 생성 및 수학 성능

미스트랄의 '라지 2' 모델은 코드 생성과 수학 분야에서 뛰어난 성능을 자랑합니다. 코드 생성 정확도를 평가하는 멀티플-E(MultiPL-E) 벤치마크에서 '라지 2'는 'GPT-4o'에 이어 2위를 차지했으며, 수학 중심 벤치마크인 GSM8K 및 매스 인스트럭트(Math Instruct)에서도 'GPT-4o'에 이어 2위를 차지했습니다. 이 성과는 모델의 고도화된 매개변수와 다국어 지원 기능들로 인한 것으로 판단됩니다.

3-2. 다국어 지원

미스트랄 '라지 2'는 한국어를 포함하여 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어 등 총 12개 언어를 지원합니다. 또한, 80개의 코딩 언어도 지원하여 다국어 및 다중 코딩 언어 환경에서 뛰어난 활용성을 보입니다.

3-3. MMLU, MultiPL-E, GSM8K 및 매스 인스트럭트 벤치마크 결과

'라지 2' 모델은 다양한 벤치마크에서 높은 성능을 기록했습니다. 추론 능력 측정 벤치마크인 MMLU에서 '라마 3.1-405B'와 동등한 성능을 보였고, 코드 생성 벤치마크인 휴먼 이밸(HumanEval) 및 휴먼 이밸 플러스에서 'GPT-4o'에 이어 2위를 차지했습니다. 멀티플-E(MultiPL-E) 벤치마크와 수학 중심 벤치마크인 GSM8K 및 매스 인스트럭트에서도 'GPT-4o'에 이어 2위를 차지했습니다.

3-4. 함수 호출 벤치마크 결과

'라지 2' 모델은 함수 호출 벤치마크에서 높은 성능을 발휘했습니다. 구체적으로 'GPT-4o', '클로드 3.5 소네트', '클로드 3 오퍼스'를 제치고 1위를 차지했습니다. 이는 '라지 2' 모델의 고도화된 추론 및 함수 호출 능력을 입증합니다.

4. 경쟁 모델 비교

4-1. 메타의 라마 3.1과 비교

미스트랄의 라지 2와 메타의 라마 3.1은 각각 1230억 개와 4050억 개의 매개변수를 가지고 있습니다. 미스트랄의 라지 2는 코드 생성 및 수학 성능에서 라마 3.1을 능가하며, 특히 모델의 환각 문제를 최소화하도록 설계되었습니다. 미스트랄 라지 2는 영어, 프랑스어, 독일어 등 12개 언어와 80개의 코딩 언어를 지원하나, 멀티모달 기능은 부족합니다.

4-2. 오픈AI의 GPT-4o와 비교

미스트랄 라지 2와 오픈AI의 GPT-4o는 고성능 AI 모델로 경쟁 관계에 있습니다. GPT-4o는 멀티모달 기능을 포함하고 있어 텍스트뿐 아니라 이미지와 기타 데이터를 동시에 처리할 수 있습니다. 반면, 미스트랄의 라지 2는 멀티모달 기능이 없으나, 128,000 토큰 창을 가지고 있으며, 코드 생성, 수학 및 추론 성능에서 뛰어난 성과를 보입니다.

4-3. 다중 모드 기능의 부재

미스트랄과 메타는 라지 2와 라마 3.1을 통해 고성능 AI 모델을 발표했으나, 두 모델 모두 멀티모달 기능이 없습니다. 오픈AI는 멀티모달 AI 시스템에서 경쟁사보다 앞서 있으며, 이로 인해 GPT-4o는 다양한 데이터를 동시에 처리할 수 있습니다. 현재 이들 모델의 부재한 멀티모달 기능은 AI 업계에서 중요한 차별화 요소로 작용하고 있습니다.

5. 라지 2의 한계 및 시장 반응

5-1. 멀티모달 기능의 부재

미스트랄의 라지 2는 멀티모달 기능을 지원하지 않습니다. 이는 오픈AI의 GPT-4o와 같은 모델이 이미지, 텍스트 등 다양한 데이터를 동시에 처리할 수 있는 것과 비교하여 상대적으로 뒤처지는 부분입니다. 멀티모달 기능의 부재는 라지 2가 코드 생성, 수학 및 추론 측면에서 강력한 성능을 보임에도 불구하고 제한된 용도로 사용될 수밖에 없는 약점으로 작용합니다.

5-2. 상용화 및 라이선스 모델

미스트랄의 라지 2는 전통적인 오픈 소스 모델과는 다르게 상업적 용도로 사용하기 위해서는 유료 라이선스가 필요합니다. 이는 일부 사용자에게는 큰 제약으로 작용할 수 있습니다. 라지 2는 매개변수 1230억 개로 구성되어 있어 다양한 기능을 제공하지만, 이와 같은 상용화 전략은 모델의 확산 속도를 저해할 가능성이 있습니다.

5-3. 시장 반응 및 평가

미스트랄의 라지 2는 지난 24일(현지시각) 출시 이후 시장에서 큰 관심과 긍정적인 평가를 받고 있습니다. 특히 코드 생성, 수학, 추론 측면에서 오픈AI 및 메타의 최신 모델과 동등한 성능을 자랑한다는 점이 주목을 받았습니다. 다만, 멀티모달 기능의 부재와 상업적 유료 라이선스 정책은 일부 아쉬운 평가를 받았습니다. 그럼에도 불구하고 미스트랄의 빠른 기술 발전과 높은 평가가 이어지고 있으며, AI 스타트업으로서 시장에서 입지를 강화하고 있습니다.

6. 미스트랄의 향후 계획 및 전망

6-1. 펀딩 및 기업 가치

미스트랄은 제너럴 캐털리스트(General Catalyst)가 주도하는 시리즈 B 펀딩 라운드에서 6억 4천만 달러를 모금하여 60억 달러의 평가를 받았습니다. 이 스타트업은 인공지능 분야에 비교적 최근에 진입했음에도 불구하고 빠르게 최첨단 AI 모델을 출시하며 높은 평가를 받고 있습니다. 이는 향후 연구 개발에 필요한 자금을 성공적으로 확보하고 있음을 의미합니다.

6-2. 향후 연구 및 개발 방향

미스트랄은 향후 연구 개발에서 모델의 환각 문제를 최소화하는 것을 주요 초점으로 삼고 있습니다. 라지 2는 모르는 것을 그럴듯하게 지어내는 대신, 모른다고 인정하도록 신중하게 반응하도록 훈련되었습니다. 미스트랄은 이러한 접근을 통해 모델의 신뢰성을 높이고자 합니다. 또한, 다국어 지원 기능을 지속적으로 향상시키고 있으며, 다양한 코딩 언어도 지원하고 있습니다. 그러나 상업적 용도로 모델을 사용하려면 유료 라이선스가 필요하며, 이는 상용화에서의 일부 제약으로 작용하고 있습니다.

7. 결론

미스트랄 AI의 '라지 2'는 코드 생성, 수학, 추론 분야에서 고유의 높은 성능을 자랑하며, 여러 언어와 코딩 언어를 지원하여 실질적으로 다양한 응용 분야에서 사용할 수 있습니다. 주요 벤치마크에서 우수한 성과를 기록하며 기술력을 입증했지만, 멀티모달 기능이 없다는 점에서 오픈AI의 GPT-4o와 같은 모델에 비해 한계가 있습니다. 상업적 유료 라이선스 정책은 일부 사용자의 접근을 제한할 수 있습니다. 향후 연구 개발 방향으로는 멀티모달 기능 추가 및 환각 문제 최소화가 주요 과제가 될 것으로 보입니다. 미스트랄 AI는 여전히 빠른 기술 발전 속도를 유지하며 긍정적인 시장 평가를 받고 있습니다. 앞으로도 AI 스타트업으로서 강력한 입지를 다질 것으로 기대됩니다.

8. 용어집

8-1. 미스트랄 AI [회사]

프랑스에 본사를 둔 인공지능 스타트업으로, 최신 AI 모델 '라지 2'를 출시하며 AI 시장에서 빠르게 성장하고 있는 기업입니다.

8-2. 라지 2 [제품]

미스트랄 AI가 개발한 최첨단 AI 모델로, 코드 생성, 수학, 추론에서 뛰어난 성능을 보입니다. 1230억 개의 매개변수를 가지고 있으며, 다국어 및 다중 코드 언어를 지원합니다.

8-3. 오픈AI [회사]

전 세계적으로 유명한 인공지능 연구소로, GPT-4o와 같은 다중 모드 AI 모델을 개발하여 AI 기술 발전에 큰 영향을 미치고 있습니다.

8-4. 메타 [회사]

페이스북의 모회사로, 최근 라마 3.1 모델을 출시하여 AI 모델 경쟁에 참가하고 있는 주요 기술 기업입니다.

9. 출처 문서

미스트랄, 최첨단 AI 모델 라지 2(Large 2) 출시 - 토큰포스트https://www.tokenpost.kr/article-189015?section=industries
하루 만에 "라마 3.1 능가" 모델 등장...미스트랄, 매개변수 123B '라지 2' 출시https://www.aitimes.com/news/articleView.html?idxno=161918
미스트랄·메타 ‘최신 AI’ 내놓았지만… ‘챗GPT’ 못 넘어서는 이유는https://news.zum.com/articles/92223743