Your browser does not support JavaScript!

LG 엑사원 3.0: 한국어 특화 AI 모델의 공개와 그 의미

일일 보고서 2024년 09월 12일
goover

목차

  1. 요약
  2. 엑사원 3.0 공개 배경 및 의의
  3. 엑사원 3.0의 기술적 성과
  4. 벤치마크 성과와 비교
  5. 엑사원 3.0의 활용도 및 응용 분야
  6. 경제성 및 사회적 영향
  7. 결론

1. 요약

  • 이 리포트는 LG AI연구원이 공개한 '엑사원(EXAONE) 3.0' 모델을 다룹니다. 엑사원 3.0은 성능과 경제성을 대폭 개선하여, 특히 한국어 성능에서 세계 최고를 기록하였습니다. LG는 이 모델을 오픈소스로 공개하여 연구 생태계에 기여하려고 합니다. 리포트는 엑사원 3.0의 공개 배경, 성능 개선 사항, 응용 분야, 그리고 이를 통한 LG의 전략을 심도 있게 분석합니다. 주요 내용으로는 모델의 성능 및 경제성 향상, 벤치마크 테스트에서의 우수성, LG 계열사 제품 및 서비스에서의 활용 계획, 그리고 AI 생태계 발전을 위한 LG의 전략적 목표가 포함됩니다.

2. 엑사원 3.0 공개 배경 및 의의

  • 2-1. 처음으로 오픈소스로 공개된 한국어 특화 AI 모델

  • LG는 2024년 9월 7일, 7.8B 매개변수를 가진 AI 모델인 ‘엑사원(EXAONE) 3.0’을 최초로 오픈소스로 공개하였습니다. 이는 한국어 특화 AI 모델로, 국내 오픈 소스 모델이 세계 시장에서 경쟁력을 갖춘 사례로 평가받고 있습니다. LG AI연구원은 이 모델이 비슷한 크기의 글로벌 모델들과 대등한 성능을 보인다고 강조하였으며, 이는 AI 생태계의 발전에 중요한 역할을 할 것으로 기대됩니다.

  • 2-2. AI 생태계 발전을 위한 LG의 전략

  • LG AI연구원은 새로운 모델의 오픈 소스 공개를 통해 AI 기술을 학계, 연구기관, 스타트업 등이 활용할 수 있도록 하여 개방형 AI 연구 생태계의 활성화를 목표로 하고 있습니다. 연구원은 '현재의 모델을 공개하는 것이 AI 생태계에 긍정적인 영향을 줄 것'이라고 판단하였고, 그 결과 ‘챗엑사원(ChatEXAONE)’의 베타 서비스를 함께 선보였습니다. 또한, 이 모델은 추론 처리 시간 56% 감소, 메모리 사용량 35% 감소, 운영 비용 72% 절감을 기록하여 경제성 또한 뛰어난 모습을 보이고 있습니다.

  • 2-3. 오픈소스 공개에 대한 내부 우려와 그 해결

  • LG는 엑사원 3.0을 오픈소스로 공개하는 과정에서 기술적 및 사업적 손실이 발생할 수 있다는 내부 우려가 있었으나, 이러한 걱정은 AI 기술의 빠른 발전 속도와 개방형 연구의 필요성을 감안하여 해결되었습니다. LG AI연구원은 오픈소스 모델이 AI 생태계에 미치는 긍정적 영향을 강조하며, 생태계 발전이 먼저라는 입장을 명확히 하였습니다.

3. 엑사원 3.0의 기술적 성과

  • 3-1. 72% 절감된 구동 비용과 향상된 성능

  • 엑사원 3.0은 이전 모델인 엑사원 2.0 대비 성능이 56% 향상되었으며, 구동 비용을 72% 절감하였습니다. LG AI연구원은 이러한 개선을 통해 AI의 경제성을 높이고, 실제 산업 현장에서의 적용 가능성을 확대하고자 하였습니다. 특히, 모델 크기를 기존 거대 모델 대비 100분의 3로 줄이면서도 성능을 대폭 향상시키는 데 성공하였습니다.

  • 3-2. 추론 처리 시간과 메모리 사용량의 개선

  • 엑사원 3.0은 메모리 사용량을 35% 줄이고, 추론 처리 시간 또한 56% 단축시키는 성과를 달성하였습니다. 이러한 성능 개선은 AI 기술의 활용성을 확대하며, 실사용 환경에서의 효율성을 높이는 데 기여하고 있습니다.

  • 3-3. 한국어와 영어 이중언어 모델로서의 성능

  • 엑사원 3.0은 한국어와 영어에 대한 이중언어 모델로서의 성능이 뛰어나며, 한국어 성능에서 세계 최고 수준을 기록하였습니다. 2021년 12월 처음 공개된 엑사원 1.0 모델 이래로, LG AI연구원은 이 모델을 통해 생성형 AI 기술을 지속적으로 발전시켜왔습니다. 2023년 7월에 발표된 엑사원 2.0은 신뢰성과 전문성을 고도화하였고, 이번 엑사원 3.0은 그러한 성과를 더 발전시킨 모델로 평가받고 있습니다.

4. 벤치마크 성과와 비교

  • 4-1. 코딩과 수학 영역 등 13개 벤치마크에서 1위

  • LG의 ‘엑사원(EXAONE) 3.0’ 모델은 코딩과 수학 영역을 포함한 13개의 벤치마크에서 1위를 차지하였습니다. 이는 엑사원 3.0이 한국어 전 영역에서 최고의 성능을 기록했음을 의미하며, 다국어 모델로서의 가능성도 보여주고 있습니다.

  • 4-2. 글로벌 동급 모델과의 비교: 메타 라마, 구글 젬마 등

  • 엑사원 3.0은 글로벌 동급 모델인 메타의 ‘라마 3.1 8B’, 알리바바의 ‘큐원 2 7B’, 구글의 ‘젬마 2 9B’, 마이크로소프트의 ‘파이 3 7B’, 미스트랄 AI의 ‘미스트랄 7B’와 비교에서도 뛰어난 성능을 보였습니다. LG AI연구원은 이번 모델이 비슷한 크기의 모델들과 비교하여 우수하다고 강조하였습니다.

  • 4-3. 25개 벤치마크의 세부 내용과 성능 평가

  • 엑사원 3.0은 25개의 주요 벤치마크에서 성능 평가를 실시하였으며, 이 결과는 기술 보고서에서 모두 공개되었습니다. 이 보고서에는 매개변수, 학습 데이터 토큰, 모델 학습 방법, 그리고 성능 평가 결과 등이 포함되어 있으며, 성능과 경제성을 핵심 요소로 하여 다양한 분야에서의 활용 가능성을 제시하고 있습니다.

5. 엑사원 3.0의 활용도 및 응용 분야

  • 5-1. LG 계열사 제품 및 서비스 적용 계획

  • LG는 엑사원 3.0을 하반기부터 그룹 계열사 제품 및 서비스에 본격적으로 도입할 계획입니다. 앞선 버전인 엑사원 2.0 또한 LG그룹 계열사에서 업무에 활용하였으나, 이제는 제품과 서비스에도 확대 적용할 것입니다. LG 계열사들은 각자가 보유한 데이터를 추가로 학습시켜 엑사원 3.0을 최적화하고, 사업 및 제품·서비스 특성에 맞게 활용할 예정입니다.

  • 5-2. 다양한 업무에서의 활용: 챗엑사원의 도입

  • LG는 엑사원 3.0 기반의 생성 AI 서비스 ‘챗엑사원’의 베타 서비스를 시작하였습니다. 이 챗엑사원은 검색, 요약, 번역, 데이터 분석, 보고서 작성, 코딩 등 다양한 업무 전반에 활용될 수 있습니다. 이를 통해 임직원은 AI를 다양한 업무에 적용하여 업무 방식 혁신을 경험하게 될 것입니다.

  • 5-3. 향후 확장 분야: 법률, 바이오, 의료, 교육 등

  • LG AI연구원은 엑사원 3.0의 성능을 향후 법률, 바이오, 의료, 교육 및 외국어 등 다양한 분야로 확장할 계획입니다. 이를 통해 연말까지 학습 데이터 양을 1억 건 이상으로 늘리며, 한국어와 영어를 학습하고 이해할 수 있는 이중언어 모델로서의 기능을 지속적으로 발전시킬 것입니다.

6. 경제성 및 사회적 영향

  • 6-1. 이윤 창출보다 생태계 발전 우선

  • LG AI연구원은 엑사원 3.0 모델 공개에 있어 이윤 창출보다는 AI 생태계의 발전이 더 중요하다는 입장을 밝혔습니다. 엑사원 3.0은 기술적 및 사업적 이점을 포기하는 것이 아니냐는 우려가 있었으나, AI 기술이 빠르게 발전하는 현 상황에서 공개가 긍정적인 영향을 미칠 것이라고 판단하였습니다.

  • 6-2. 연구 생태계 활성화와 국가 AI 경쟁력 강화

  • LG그룹은 2026년까지 AI 및 데이터 연구개발에 3조6000억 원을 투입할 계획을 세우고 있습니다. 이 전략의 일환으로 엑사원 3.0 모델을 오픈소스로 공개하여 AI 연구 생태계에 기여하고 있습니다. 이를 통해 국내 AI 경쟁력을 높이고 다양한 산업 현장에서의 활용을 기대하고 있습니다.

  • 6-3. 오픈소스 AI 모델의 글로벌 트렌드: 메타와의 비교

  • 현재 AI 업계에서는 오픈소스 AI 모델이 중요한 화두로 떠오르고 있습니다. 특히 메타는 최근 자사 최신 AI 모델 라마 3.1을 오픈소스로 공개했습니다. LG AI연구원은 엑사원 3.0 모델 중 성능과 경제성이 가장 우수한 경량 모델을 연구 목적에 사용할 수 있도록 공개하였으며, 이는 글로벌 오픈소스 AI 트렌드와 맥을 같이합니다.

7. 결론

  • 엑사원 3.0은 국내 최초로 오픈소스로 공개된 한국어 특화 AI 모델로서 성능과 경제성을 크게 향상시켰습니다. 이는 AI 연구 생태계 발전에 중요한 기여를 하며, 국가의 AI 경쟁력을 높이는 데 중요한 역할을 합니다. LG 계열사 제품과 서비스에 적용되어 실제 산업 현장에서의 활용도가 증가할 예정이며, 이로 인해 다양한 응용 가능성이 높아집니다. 연구 생태계 활성화와 사회적 영향을 고려할 때 엑사원 3.0은 향후 AI 연구에 중요한 이정표가 될 것입니다. 다만, 기술 공개에 따른 사업적 우려는 있었으나 개방형 연구의 필요성과 신속한 기술 발전을 고려하여 긍정적인 영향을 미칠 것으로 판단됩니다. 앞으로 법률, 바이오, 의료, 교육 등 다양한 분야에서 확장 가능성을 지니며, 지속적인 발전이 기대됩니다.

8. 용어집

  • 8-1. 엑사원 3.0 [AI 모델]

  • LG AI연구원이 자체 개발한 초거대 대규모언어모델(LLM)로, 성능과 경제성을 대폭 개선하고 한국어 성능에서 세계 최고를 기록했습니다. 오픈소스로 공개되어 연구 생태계 발전에 기여하고 있으며, LG 계열사 제품 및 서비스에 적용될 예정입니다.

  • 8-2. LG AI연구원 [회사]

  • LG 그룹 산하의 AI 연구 기관으로, 엑사원 시리즈를 포함한 다양한 AI 기술을 연구하고 개발하고 있습니다. 연구 생태계 활성화와 국가 AI 경쟁력 강화를 목표로 하고 있습니다.

  • 8-3. 챗엑사원 [AI 서비스]

  • 엑사원 3.0을 기반으로 한 생성형 AI 서비스로, LG 임직원을 대상으로 베타 서비스가 진행 중이며, 검색, 요약, 번역, 데이터 분석, 보고서 작성, 코딩 등 다양한 업무에 활용될 예정입니다.

9. 출처 문서