Your browser does not support JavaScript!

LG의 엑사원 3.0: 국내 최초의 오픈소스 AI 모델의 진화와 적용

일일 보고서 2024년 08월 19일
goover

목차

  1. 요약
  2. LG 엑사원 3.0 개요
  3. 오픈소스 공개와 그 의의
  4. 벤치마크 평가 및 성능 분석
  5. 실질적 적용 사례와 향후 계획
  6. 결론

1. 요약

  • 이 리포트는 LG AI연구원이 개발한 엑사원 3.0 모델의 성능과 실질적 적용 사례를 중심으로 분석합니다. 엑사원 3.0은 한국어 성능을 세계 최고 수준으로 끌어올린 경량화된 초거대 대규모언어모델(LLM)로, AI 연구와 실제 응용에 큰 기여를 하며 글로벌 시장에서 경쟁력을 확보하고자 합니다. 이 모델은 성능과 경제성을 모두 개선하여 추론 처리 시간, 메모리 사용량, 구동 비용 등에서 뛰어난 성과를 보였습니다. 엑사원 3.0의 오픈소스 공개는 학계와 산업계에서 긍정적인 반응을 얻고 있으며, 다양한 벤치마크 평가에서도 최고 성능을 기록했습니다. LG는 이를 통해 AI 생태계 발전과 다양한 산업 분야에서의 적용을 촉진하려 하고 있습니다.

2. LG 엑사원 3.0 개요

  • 2-1. 엑사원 3.0의 발표 배경과 목적

  • LG AI연구원은 엑사원 3.0을 발표하면서 AI 연구 생태계 발전에 기여하기 위해 경량 모델을 오픈소스로 공개한다고 밝혔습니다. 엑사원 3.0은 한국어 성능을 세계 최고 수준으로 끌어올린 초거대 대규모언어모델(LLM)로, AI 연구와 실질적 적용을 촉진하기 위해 개발되었습니다. 특히 국내 및 글로벌 경쟁 모델과 비교하여 뛰어난 성능을 보임으로써 글로벌 AI 시장에서 경쟁력을 확보하고자 했습니다.

  • 2-2. 기술적 특징 및 성능 개선 사항

  • 엑사원 3.0은 매개변수 78억 개의 소형언어모델(sLM)로, 성능과 경제성에서 큰 개선을 이루었습니다. 기존 엑사원 2.0 대비 추론 처리 시간은 56%, 메모리 사용량은 35% 줄어들었으며, 구동 비용은 72% 절감되었습니다. 이는 오픈소스 AI 모델 중에서 첫 번째로 글로벌 인기 모델과 비교하여 성능 및 경제성에서 우위를 점한 결과입니다.

  • 2-3. 엑사원 1.0, 2.0과의 비교

  • 엑사원 1.0은 3000억 매개변수로 구성된 대규모 모델로 처음 개발되었습니다. 그 이후 엑사원 2.0은 2023년 7월에 공개되었으며, 이를 통해 성능과 경제성 면에서 큰 발전을 이룬 바 있습니다. 엑사원 3.0은 1.0과 2.0에 비해 더 경량화되고 최적화된 성능을 보이며, 특히 국내외 다양한 벤치마크에서 최고 성능을 기록하고 있습니다.

3. 오픈소스 공개와 그 의의

  • 3-1. 학계 및 업계 반응

  • 학계와 업계에서는 LG의 엑사원 3.0 오픈소스 공개에 대한 긍정적인 반응이 이어지고 있습니다. LG AI연구원이 발표한 기술 보고서에 따르면, 엑사원 3.0은 추론 처리 시간과 메모리 사용량, 구동 비용 등에서 대폭적인 개선을 이루어냈습니다. 실제 사용성을 비롯해 코딩과 수학 영역 등 여러 벤치마크 점수에서도 1위를 차지했습니다. 이를 통해 LG는 학계와 연구 기관, 스타트업 등에게 최신 AI 기술을 활용할 수 있는 기회를 제공하고 있습니다.

4. 벤치마크 평가 및 성능 분석

  • 4-1. 엑사원 3.0의 벤치마크 점수와 경쟁 모델 비교

  • LG의 엑사원 3.0 모델은 벤치마크 평가에서 뛰어난 성능을 보였습니다. 주요 평가 지표로는 MT-벤치, 알파카이벨(AlpacaEval-2.0), 아레나-하드, 와일드벤치 등이 있습니다. 엑사원 3.0은 메타의 '라마 3.1 8B', 알리바바의 '큐원 2 7B', 구글의 '젬마 2 9B', 마이크로소프트의 '파이 3 7B', 미스트랄 AI의 '미스트랄 7B' 등과 비교하였으며, 그 결과 코딩과 수학 영역 등 13개 벤치마크에서 1위를 차지하였습니다. 특히 한국어 영역에서는 최고 성능을 기록했으며, 영어 추론(ARC)에서도 평균치를 기록해 다국어 모델로서의 가능성을 입증하였습니다.

  • 4-2. 코딩, 수학, 한국어 성능 등 주요 평가 항목

  • 엑사원 3.0은 코딩, 수학, 한국어 성능 평가에서 특히 두각을 나타냈습니다. 코딩 및 수학 영역에서는 대부분의 벤치마크 테스트에서 최고 점수를 기록하였고, 한국어 성능 평가에서도 모든 영역에서 최고 성능을 기록했습니다. 이러한 평가는 엑사원 3.0이 78억 개의 매개변수를 가진 소형언어모델(sLM)로서, 특허와 소프트웨어 코드, 수학, 화학 등 다양한 분야의 전문 데이터를 학습한 결과입니다.

  • 4-3. 토큰 및 학습 데이터, 학습 방법의 공개

  • LG AI연구원은 엑사원 3.0 모델의 매개변수와 학습 데이터 토큰, 모델 학습 방법, 그리고 성능 평가 결과 등의 세부 정보를 공개하였습니다. 이는 LG가 오픈소스를 통해 AI 연구 생태계의 발전에 기여하기 위한 노력의 일환이며, 모델의 경제성과 성능을 동시에 강조한 것입니다. 엑사원 3.0은 앞선 모델 '엑사원 2.0'에 비해 추론 처리 시간은 56%, 메모리 사용량은 35% 줄였고 구동 비용은 72% 절감하는 데 성공하였습니다. 이에 더해 LG는 연말까지 학습 데이터 양을 1억 건 이상으로 늘려 엑사원 3.0의 성능을 더욱 향상시킬 계획입니다.

5. 실질적 적용 사례와 향후 계획

  • 5-1. 엑사원 3.0 기반 제품 및 서비스

  • 구광모 LG그룹 회장은 엑사원 3.0을 탑재한 제품과 서비스를 하반기부터 출시할 계획입니다. LG전자와 LG CNS 등 계열사들은 각 사가 보유한 데이터를 활용해 엑사원 3.0을 최적화하고 사업과 제품, 서비스 특성에 맞게 적용할 구상을 하고 있습니다. 예를 들어, 엑사원 3.0은 추론 처리 시간을 56% 줄이고, 메모리 사용량을 35% 절감하며, 구동 비용을 72% 절감하는 등 실제 산업 현장에서 최적의 성능을 발휘할 수 있도록 설계되었습니다.

  • 5-2. AI 생태계 확장을 위한 LG의 전략

  • LG AI연구원은 엑사원 3.0의 경량 모델을 오픈소스로 공개하여 학계, 연구 기관, 스타트업 등이 활용할 수 있게 하고, 이를 통해 개방형 AI 연구 생태계 발전에 기여하고자 합니다. 또한, 엑사원 3.0은 한국어 성능에 특화되어 있어 국내 학계와 연구소를 중심으로 확산될 것으로 예상됩니다. 이는 LG가 주도하는 생성형 AI 생태계를 형성하는 데 큰 기여를 할 것입니다.

  • 5-3. 각 계열사의 데이터 및 AI 적용 계획

  • LG 계열사들은 각 사가 보유한 데이터로 엑사원 3.0을 최적화할 계획입니다. 예를 들어 LG전자는 생산 공정, 소재 및 제품 개발, 고객 서비스 개선 등 다양한 분야에서 AI 기술을 적용하고 있으며, 이러한 AI 기술 적용 사례는 계속해서 늘어가고 있습니다. LG AI연구원은 ‘온디바이스 AI’(기기 내장형 인공지능)를 위한 초경량 모델부터 특화된 고성능 모델까지 다양한 용도에 맞는 AI 모델을 설계하여 각 계열사와의 파트너십을 강화하고 있습니다.

6. 결론

  • 본 리포트는 LG의 엑사원 3.0 모델이 국내 최초 오픈소스 AI 모델로서 가지는 의의와 LG의 전략적 포지셔닝을 심도 있게 분석했습니다. 엑사원 3.0은 성능과 경제성 면에서 글로벌 경쟁 모델을 능가하는 모습을 보여주었으며, 추론 처리 시간, 메모리 사용량, 구동 비용에서 현저한 개선을 이루어 실제 산업 현장에서 활용 가능성을 증명했습니다. LG의 오픈소스 공개 전략은 AI 생태계의 발전에 긍정적인 영향을 미치며, 향후 다양한 산업 분야에서 엑사원의 적용이 증가할 것으로 기대됩니다. 다만, 글로벌 AI 시장의 경쟁이 치열하기에 지속적인 성능 개선과 학습 데이터 확대가 필요합니다. 향후 LG는 엑사원 3.0을 바탕으로 다양한 제품과 서비스를 출시하고, AI 생태계 확장을 통해 시장에서의 경쟁력을 강화할 계획입니다.

7. 용어집

  • 7-1. 엑사원 3.0 [AI 모델]

  • LG AI연구원에서 개발한 최신 초거대 인공지능 언어 모델로, 경량화와 경제성 개선을 통해 다양한 산업 분야에서 활용될 수 있습니다.

  • 7-2. LG AI연구원 [연구 기관]

  • LG그룹 산하의 AI 연구 기관으로, 엑사원 시리즈를 개발하며 AI 생태계 발전에 기여하고 있습니다.

  • 7-3. 구광모 [인물]

  • LG그룹의 회장으로, AI와 데이터 연구개발에 많은 투자를 하고 있으며 엑사원 프로젝트를 주도하고 있습니다.

  • 7-4. 챗엑사원 [생성형 AI]

  • 엑사원 3.0을 기반으로 개발된 생성형 AI로, 문서와 이미지 기반 질의응답, 데이터 분석 등의 기능을 제공하는 시험용 서비스입니다.

  • 7-5. 오픈소스 [기술]

  • AI 모델이나 소프트웨어의 소스 코드를 공개하여 발전시키는 방식으로, 엑사원 3.0은 국내 최초로 오픈소스로 공개된 AI 모델입니다.

8. 출처 문서