Your browser does not support JavaScript!

LG의 엑사원 3.0: 국내 최초 오픈소스 AI 모델의 등장과 성능 분석

일일 보고서 2024년 09월 08일
goover

목차

  1. 요약
  2. LG 엑사원 3.0 소개
  3. 엑사원 3.0의 성능 분석
  4. 경제성 및 최적화
  5. AI 생태계 활성화
  6. 적용 사례 및 활용 계획
  7. 결론

1. 요약

  • LG가 자사의 인공지능 모델 '엑사원 3.0'을 오픈소스로 공개하며 업계에 큰 파장을 일으켰다. 엑사원 3.0은 78억 개의 매개변수를 가진 소형 언어 모델로, 글로벌 인기 모델인 '라마 3.1 8B', '큐원 2 7B', '미스트랄 7B' 등과 비교하여 성능이 우수하다. 이 리포트는 엑사원 3.0의 성능, 경제성, 활용성 등을 다양한 벤치마크 결과와 함께 분석하며, LG의 AI 연구 생태계에 미치는 영향을 다룬다. 모델의 성능은 한국어와 영어 이중 언어 모델로서 세계 최고 수준을 자랑하며, 추론 처리 시간, 메모리 사용량, 구동 비용 등의 경제성을 크게 개선하였다. LG는 엑사원 3.0을 통해 고객 경험 혁신 및 다양한 산업 현장에의 적용을 계획하고 있다.

2. LG 엑사원 3.0 소개

  • 2-1. 엑사원 3.0 개요

  • LG가 오픈 소스로 공개한 '엑사원 3.0'은 78억 개의 매개변수를 가진 소형 언어 모델입니다. 이 모델은 글로벌 인기 모델인 '라마 3.1 8B', '큐원 2 7B', '미스트랄 7B' 등과 비교할 때 성능이 뛰어난 것으로 평가받고 있습니다.

  • 2-2. 오픈소스 공개 배경

  • LG AI 연구원은 'AI 연구 생태계 발전'을 위해 엑사원 3.0의 경량 모델을 오픈소스로 공개하였으며, 이는 국내에서 모델 출시와 기술 리포트를 동시에 발표한 사례 중 하나입니다. 이에 따라 모델의 성능 및 경제성을 강조하고 있으며, 지난해 7월 공개된 '엑사원 2.0'에 비해 추론 처리 시간은 56%, 메모리 사용량은 35% 줄여 구동 비용을 72% 절감하는 성과를 거두었습니다.

  • 2-3. 고객경험 및 혁신 전략

  • LG는 2021년 12월 엑사원 1.0을 발표한 이후 매년 성능을 개선해왔습니다. LG그룹은 2026년까지 AI 및 데이터 연구개발에 3조6000억원을 투입하겠다고 밝혔으며, 엑사원 3.0을 활용하여 새로운 고객 경험과 혁신적인 제품 및 서비스 출시에 본격적으로 나설 계획입니다.

3. 엑사원 3.0의 성능 분석

  • 3-1. 매개변수 및 학습 데이터

  • LG가 오픈 소스로 공개한 엑사원 3.0은 78억 개의 매개변수를 갖춘 소형 언어 모델(sLM)입니다. 이 모델은 6000만 건 이상의 데이터로 학습하였으며, 전문 분야로는 특허, 소프트웨어 코드, 수학, 화학 등이 포함되어 있습니다. 엑사원 3.0의 성능은 이전 모델인 엑사원 2.0에 비해 추론 처리 시간은 56%, 메모리 사용량은 35% 감소시켰고, 구동 비용은 72% 절감하였습니다.

  • 3-2. 벤치마크 결과

  • 엘사원 3.0은 코딩과 수학 영역 등 13개 벤치마크에서 1위를 차지하였습니다. 주요 비교 모델로 메타의 '라마 3.1 8B', 구글의 '젬마 2 9B' 등이 있으며, 엑사원 3.0은 한국어 전 영역에서 최고 성능을 기록했습니다. 영어의 추론 성능에서도 평균치를 달성하여 다국어 모델로서의 가능성을 보여주었습니다. LG는 이번 모델의 성능을 다양한 벤치마크를 통해 입증하며, 신뢰성을 높이고 있습니다.

  • 3-3. 이중 언어 모델로서의 우수성

  • 엑사원 3.0은 한국어와 영어를 학습하고 이해할 수 있는 이중 언어 모델로, 특히 한국어 성능에서 세계 최고 수준을 자랑합니다. LG AI 연구원은 이 모델이 다양한 언어로 능숙하게 소통할 수 있도록 설계하였으며, 향후 법률, 바이오, 의료, 교육, 외국어 등의 분야로 학습 데이터 양을 1억 건 이상으로 늘려 성능을 더욱 끌어올릴 계획임을 밝혔습니다.

4. 경제성 및 최적화

  • 4-1. 구동 비용 절감

  • 엑사원 3.0은 구동 비용을 72% 절감하는 성과를 이루었습니다. 이는 이전 모델인 엑사원 2.0과 비교했을 때 더욱 향상된 수치로, LG는 이를 통해 인공지능 모델의 경제성을 강조하고 있습니다.

  • 4-2. 메모리 사용량 감소

  • 엑사원 3.0은 메모리 사용량을 35% 줄이는 성과를 달성하였습니다. 이러한 메모리 최적화는 모델의 효율성을 높이는 데 기여하고 있으며, LG AI 연구원은 이를 통해 실제 사용 가능성을 더욱 높이고 있습니다.

  • 4-3. 경량화 및 최적화 기술

  • LG는 엑사원 3.0 모델을 개발하는 과정에서 경량화 및 최적화 기술에 집중하였고, 그 결과 모델 크기를 원래보다 100분의 3로 줄이는 데 성공하였습니다. 이러한 경량화는 모델의 성능을 높이며, 전력 소비 문제를 해결하는 데도 도움을 주었습니다. 또한, LG는 각종 벤치마크 평가에서 1위를 기록하며 모델의 성능을 증명하였습니다.

5. AI 생태계 활성화

  • 5-1. 오픈소스 공개의 의미

  • LG AI연구원이 7일 발표한 ‘엑사원 3.0’은 경량 모델인 7.8B 언어 모델을 오픈 모델로 공개하였습니다. 이는 AI 연구 생태계의 활성화를 위한 결정으로, LG의 모델이 내부에서만 사용되던 과거와는 다른 접근방식입니다. 연구 기관이나 기업은 이 모델을 국내외 전문 데이터 6000만 건 이상을 학습한 결과로, AI 기술이 빠르게 발전하는 환경에서 학계, 연구 기관, 개인들이 엑사원을 활용해 연구에 기여할 수 있게 됩니다. LG AI연구원 측은 이 오픈소스 공개가 AI 생태계에 긍정적인 영향을 미칠 것이라 판단하여 발표하였습니다.

  • 5-2. 연구 생태계 발전 기여

  • LG의 ‘엑사원 3.0’ 공개는 AI 연구 생태계 발전에 기여할 것으로 기대됩니다. 연구 목적으로 누구나 활용할 수 있는 오픈 모델은 학계와 스타트업을 포함한 다양한 연구 주체가 최신 생성형 AI 기술을 활용할 수 있는 기회를 제공합니다. 배경훈 LG AI연구원장은 ‘국내에서는 처음으로 자체 개발한 AI 모델을 오픈소스로 공개함으로써 AI 생태계를 활성화하고 국가 AI 경쟁력을 높이고자 한다’고 밝혔습니다. 이러한 결정은 연구 분야의 혁신을 촉진시킬 것으로 보입니다.

  • 5-3. 국가 AI 경쟁력 강화

  • LG의 ‘엑사원 3.0’은 국내 첫 오픈소스 AI 모델로서, 메타와 구글과 같은 글로벌 기업에도 뒤지지 않는 경쟁력 있는 성능을 보여줍니다. 모델은 이전 버전인 엑사원 2.0에 비해 추론 처리 시간은 56%, 메모리 사용량은 35% 줄이며, 구동 비용은 72% 절감하는 성과를 이루었습니다. 이러한 성능적 우위는 LG가 AI 산업에서 중요한 위치를 차지할 수 있도록 하여, 국가의 AI 경쟁력 또한 강화하는 일에 기여할 것입니다.

6. 적용 사례 및 활용 계획

  • 6-1. LG 계열사 적용 계획

  • LG는 자신이 개발한 인공지능 모델 ‘엑사원 3.0’을 하반기부터 그룹 계열사 제품과 서비스에 본격적으로 도입할 예정입니다. 앞서 선보인 엑사원 2.0 역시 LG그룹 계열사에서 업무에 활용되었으나, 이제 제품 및 서비스로의 확대 적용이 이루어진다고 밝혔습니다. LG 계열사는 각사가 보유한 데이터를 추가로 학습시켜 엑사원 3.0을 최적화하고 이 모델을 사업, 제품, 서비스의 특성에 맞추어 활용할 계획입니다.

  • 6-2. 임직원을 위한 '챗엑사원' 베타 서비스

  • LG는 지난 7일부터 임직원을 대상으로 엑사원 3.0을 기반으로 한 생성 AI 서비스인 ‘챗엑사원’의 베타 서비스를 시작하였습니다. 이 서비스는 검색, 요약, 번역, 데이터 분석, 보고서 작성, 코딩 등 다양한 업무에서 활용될 수 있는 기능을 제공합니다. 챗엑사원은 실시간 웹 정보 기반으로 질의응답을 수행하며, 문서와 이미지 기반 질문도 가능하여 LG 임직원들이 더욱 효율적으로 업무를 수행할 수 있도록 돕고 있습니다.

  • 6-3. 산업 현장 적용 및 파트너십 강화

  • LG AI연구원은 엑사원 3.0을 활용하여 LG 계열사뿐만 아니라 외부 기업 및 기관과의 파트너십을 강화해 나갈 계획입니다. 특히 LG유플러스는 엑사원에 자체 통신 데이터를 학습시켜 소형언어모델인 ‘익시젠’을 개발하였고, 이러한 특화된 성능과 경제성을 바탕으로 다양한 산업 현장에서의 실질적인 활용 가능성을 증명하는 데 집중하고 있습니다. 향후에도 LG는 AI 기술의 개발 및 적용에 있어 계속해서 혁신을 이루어 낼 것이라고 언급하였습니다.

7. 결론

  • LG의 엑사원 3.0은 국내 최초로 오픈소스로 공개된 대규모 언어 모델로서, 특히 한국어와 영어의 이중 언어 모델 성능에서 세계 최고를 기록하고 있다. 다양한 벤치마크에서 우수한 성과를 보여주며, 경제성 또한 탁월하여 AI 생태계 활성화와 국가 AI 경쟁력 강화에 크게 기여하고 있다. LG AI 연구원은 엑사원 3.0을 개발한 과정에서 경량화 및 최적화 기술을 통해 성능을 극대화시켰다. LG는 이 모델을 그룹 계열사 제품과 서비스에 본격적으로 도입할 예정이며, 이미 임직원을 대상으로 한 '챗엑사원' 베타 서비스로 그 실효성을 검증하고 있다. 이번 오픈소스 공개는 AI 연구 생태계 발전을 촉진할 중요한 이정표로 자리매김할 것이며, 향후 더욱 많은 데이터와 연구 활동을 통해 엑사원 3.0의 성능이 지속적으로 향상될 것이다. 한편, 모델의 한계로는 아직 개발 초기 단계이기 때문에 실제 현장 적용에서 추가적인 검증이 필요하며, 이를 보완하기 위해 LG는 지속적인 연구개발과 데이터 축적을 계획하고 있다.

8. 용어집

  • 8-1. 엑사원 3.0 [AI 모델]

  • LG가 개발한 초거대 대규모 언어 모델로, 오픈소스로 공개되어 AI 연구 생태계 활성화에 기여하고 있으며, 한국어와 영어 이중 언어 모델 성능에서 우수성을 보인다.

  • 8-2. LG AI 연구원 [연구 기관]

  • LG그룹 산하의 AI 연구 조직으로, 엑사원 3.0을 개발하고 오픈소스로 공개하여 연구 생태계 발전에 중요한 역할을 수행하고 있다.

  • 8-3. 챗엑사원 [AI 서비스]

  • 엑사원 3.0을 기반으로 한 생성형 AI 서비스로, LG 임직원을 대상으로 베타 서비스가 시작되었으며, 다양한 업무에서 AI를 활용할 수 있는 기능을 제공한다.

9. 출처 문서