본 리포트는 LG가 2024년 9월 1일에 공개한 엑사원(EXAONE) 3.0 모델의 성능과 경제성, 그리고 그 영향력을 분석합니다. 엑사원 3.0은 78억 개의 매개변수를 가진 초거대 언어 모델로, LG AI연구원이 개발하였으며, 성능을 크게 향상시켰습니다. 13개 벤치마크 중 코딩과 수학 영역에서 1위를 차지하며, 글로벌 오픈 소스 모델들과 비교해 성과가 우수했습니다. 오픈소스로 공개되어 학계와 연구기관, 스타트업 등이 활용할 수 있도록 설계되었으며, 국내 AI 연구 생태계와 다양한 산업에 미치는 영향을 다룹니다.
LG가 2024년 9월 1일에 오픈 소스 모델 ‘엑사원(EXAONE) 3.0’을 공개하였습니다. 이 모델은 78억 개의 매개변수로 구성된 초거대 언어 모델이며, LG AI 연구원에 의해 개발되었습니다. 엑사원 3.0은 '챗엑사원'이라고 명명된 AI 에이전트 서비스의 베타 버전도 출시되며, 이는 LG 임직원들이 활용할 수 있는 형태로 제공됩니다.
엑사원 3.0은 이전 버전인 엑사원 2.0 대비 다음과 같은 주요 개선 사항을 가지고 있습니다. - 추론 처리 시간 56% 단축 - 메모리 사용량 35% 감소 - 구동 비용 72% 절감 이와 같은 성능 향상은 전력 문제를 해결하는데도 기여하며, 모델 크기는 이전 모델의 100분의 3으로 줄이는 데 성공하였습니다.
엑사원 3.0은 다양한 벤치마크 테스트에서 뛰어난 성능을 보였습니다. - 13개 벤치마크 중 코딩과 수학 영역에서 1위를 차지하는 등 글로벌 오픈 소스 모델들과 비교에서도 우수한 성과를 나타냈습니다. - 한국어 성능은 평균적으로 가장 높은 평가를 받았으며, 영어 추론에서도 괜찮은 결과를 보였습니다. - 현재 엑사원 3.0은 6000만 건 이상의 전문 분야 데이터를 학습하였으며, 연말까지 해당 데이터를 1억 건 이상으로 늘릴 계획입니다.
LG AI연구원이 엑사원(EXAONE) 3.0을 오픈소스로 공개한 배경은 AI 연구 생태계 발전에 기여하기 위함입니다. LG는 2024년 8월 7일에 발표한 바와 같이, 성능과 경제성이 뛰어난 '경량 모델'인 7.8B 언어 모델을 오픈 모델로 공개하여 학계, 연구기관, 스타트업 등이 이를 활용할 수 있도록 하였습니다. LG는 이번 공개를 통해 AI 기술이 빠르게 발전하는 상황에서, 다양한 연구자들이 엑사원을 활용하여 연구 생태계를 활성화하겠다는 의지를 나타냈습니다.
엑사원 3.0은 7.8B 매개변수로 구성되어 있으며, 메타의 라마 3.1 8B, 구글의 젬마 2 9B 등과 비교하였을 때 성능에서 우수함을 입증하였습니다. 특히, 코딩과 수학 영역을 포함한 13개 벤치마크에서 1위를 차지했으며, 한국어 전 영역에서 최고 성능을 기록하였습니다. LG AI연구원장은 이러한 성과는 특허와 소프트웨어 코드, 수학 및 화학 분야의 6000만 건 이상의 데이터를 학습한 결과라고 설명하였습니다.
LG의 엑사원 3.0 공개는 국내 AI 연구 생태계에 긍정적인 영향을 미칠 것으로 예상됩니다. 오픈소스로 제공됨에 따라 학계와 연구기관, 스타트업 등 다양한 연구자들이 쉽게 접근하여 사용할 수 있는 기회가 제공됩니다. LG는 연말까지 법률, 바이오, 의료, 교육, 외국어 등 다양한 분야로 학습 데이터의 양을 1억 건 이상으로 확대하여 성능을 더욱 개선할 계획입니다. 이는 국내 AI 연구 생태계의 발전을 도모하는 한편, AI 기술의 효과적인 활용을促进하게 될 것입니다.
LG AI연구원이 엑사원 3.0을 오픈 모델로 공개한 이후, 학계와 업계에서 긍정적인 평가가 이어졌습니다. 특히 연구 생태계의 활성화에 기여하기 위해 경량 모델인 7.8B 언어모델을 공개한 점이 주목받고 있습니다. LG가 해당 모델을 내부에서만 사용하기로 했던 결정을 바꾼 것은 놀라운 변화로 평가되고 있으며, AI 기술의 빠른 발전 속도에 발맞추어 많은 연구자들이 활용할 수 있는 기회를 제공하고 있습니다. 이에 따라, 업계 전문가들은 LG의 결정을 매우 긍정적으로 보고 있습니다.
엑사원 3.0은 글로벌 오픈 소스 모델인 라마 3.1 8B, 큐원 2 7B, 미스트랄 7B와 비교하여 성능이 우수함을 입증했습니다. LG AI연구원에 따르면, 이 모델은 총 13개의 벤치마크에서 1위를 차지했으며, 코딩과 수학 영역에서도 최고의 성능을 기록했습니다. LG는 이를 통해 엑사원 3.0이 다국어 모델로서의 가능성을 지니고 있음을 보였습니다. 또한, 학습 데이터는 약 6000만 건 이상의 전문 분야 데이터로 구성되어 있으며, 연말까지 1억 건 이상으로 확대할 계획입니다.
LG의 엑사원 3.0 공개 이후, AI 업계에서는 다양한 협업과 반응을 보이고 있습니다. 많은 기업과 연구기관들이 이 모델을 활용하여 자체적인 연구를 진행하고 있으며, LG는 자신의 제품과 서비스에 엑사원 3.0을 적용하기 위한 작업을 본격적으로 진행하고 있습니다. 또한, 챗엑사원이라는 엑사원 3.0 기반의 AI 에이전트 서비스 베타 버전도 임직원을 대상으로 선보였습니다. LG는 이를 통해 업무의 효율성을 높이고, 연구 기관과의 파트너십을 강화할 계획을 가지고 있습니다.
LG는 ‘엑사원(EXAONE) 3.0’ 모델을 올 하반기부터 자사 전 계열사 제품과 서비스에 적용할 예정입니다. 각 계열사는 자사가 보유한 데이터를 바탕으로 엑사원 3.0의 최적화 작업을 수행하여 이 모델을 사업 및 제품, 서비스의 특성에 맞게 적용할 계획입니다. 구광모 LG그룹 회장은 AI 기술을 통한 미래 성장 동력 확보에 노력을 기울이고 있으며, 엑사원 3.0은 LG의 AI 사업을 본격화하는 중요한 요소로 자리매김하고 있습니다.
LG는 임직원을 대상으로 ‘챗엑사원(ChatEXAONE)’ 베타 서비스를 시작하였습니다. 이 서비스는 검색, 요약, 번역, 데이터 분석, 보고서 작성, 코딩 등 다양한 업무에서 AI를 활용할 수 있도록 설계되었습니다. 특히, ‘엑사원 3.0’이 적용된 챗엑사원은 사용자에게 빠르고 정확한 답변을 제공하여 업무 혁신을 지원하고 있습니다.
LG AI 연구원은 엑사원 3.0의 성능을 더욱 끌어올리기 위해 연말까지 법률, 바이오, 의료, 교육, 외국어 등 여러 분야로 학습 데이터를 확장하는 계획을 세우고 있습니다. 데이터 양을 1억건 이상으로 확대하여 엑사원 3.0의 활용도를 높이고, LG 계열사뿐만 아니라 외부 기관과의 파트너십을 통해 AI 기술의 발전을 도모할 것입니다.
LG 엑사원 3.0의 공개는 국내 AI 연구 생태계와 산업 전반에 걸쳐 큰 변화를 가져올 것으로 예상됩니다. 성능과 경제성 면에서 글로벌 경쟁력을 입증하였으며, 다양한 벤치마크에서 우수한 결과를 나타냈습니다. 엑사원 3.0은 오픈소스로 공개되어 학계와 연구기관, 스타트업 등이 폭넓게 활용할 수 있는 기회를 제공함으로써 연구 생태계와 산업 혁신을 촉진할 것입니다. LG는 이를 통해 AI 기술의 확장성과 지속적인 개선을 목표로 삼으며, 구광모 회장의 지도 아래 AI와 데이터 기술 분야에서의 지속적인 성장을 도모할 것입니다. 다만, 엑사원 3.0의 모델 확장성과 성능 지속 개선을 위한 지속적인 연구와 투자가 필요합니다. 향후 다양한 분야에서의 데이터 확장 계획을 통해 이 모델의 활용도를 극대화시키고, 글로벌 AI 시장에서의 경쟁력을 유지할 필요가 있습니다.