LG AI연구원이 발표한 엑사원 3.0은 한국 최초의 오픈소스 초거대 AI 모델로, 성능 개선 및 경제성 확보를 통해 글로벌 시장에서의 경쟁력을 입증하였습니다. 이 모델은 7.8억 개의 매개변수를 가진 소형 언어 모델로, 처리 시간과 메모리 사용량의 획기적인 감소를 통해 구동 비용을 크게 절감하였으며, 특히 한국어와 영어에서 뛰어난 성능을 보여줍니다. 엑사원 3.0의 오픈소스 공개는 AI 연구 생태계의 발전을 촉진하고, LG 제품과 서비스에 AI를 통해 혁신적인 변화를 가져오려는 의도가 담겨 있습니다. 이는 LG AI연구원이 메타와 구글 등 글로벌 AI 기업들과 경쟁에서 중요한 성과를 달성하는데 기여하고 있습니다.
LG AI연구원은 2021년 12월에 거대언어모델인 엑사원 1.0을 발표한 이후, 2023년 7월에 엑사원 2.0을 공개하였습니다. 최근 2024년 10월, 엑사원 3.0을 오픈소스로 공개함으로써, LG는 AI 연구 생태계의 발전에 지속적으로 기여하고 있습니다.
엑사원 3.0 모델은 7.8억 개의 매개변수를 가진 소형 언어 모델로, 성능이 56% 향상되었으며 구동 비용은 72% 절감되었습니다. 또한, 추론 처리 시간은 56% 줄어들고 메모리 사용량은 35% 감소하였습니다. 코딩과 수학 영역에서 13개 벤치마크에서 1위를 차지하며 한국어 성능 또한 세계 최고 수준을 기록하였습니다.
LG AI연구원은 'AI 연구 생태계 발전'을 위한 목표로 엑사원 3.0을 오픈소스로 공개하였습니다. 이를 통해 학계, 연구기관, 스타트업 등 다양한 연구 주체들이 최신 생성형 AI 기술을 활용할 수 있도록 하여, 개방형 AI 연구 생태계를 활성화하고 국가 AI 경쟁력을 높이는 데 기여하고자 합니다. 오픈소스 모델 공개는 국내에서 최초로 이루어진 사례로, 이는 LG AI 모델의 기술적, 사업적 이점을 포기하지 않고 생태계에 긍정적인 영향을 미치기 위한 의도에서 비롯되었습니다.
LG는 엑사원 3.0의 경량 모델을 설계하며 성능과 경제성 모두를 고려하였습니다. 이 모델은 이전 버전인 엑사원 2.0에 비해 추론 처리 시간은 56%, 메모리 사용량은 35%, 구동 비용은 72% 절감되는 성과를 보였습니다. 이러한 최적화는 AI의 실제 사용성을 높이며 다양한 산업 분야에서 활용될 수 있는 가능성을 제시합니다. 경량 모델은 특히 소형 언어 모델(sLLM)인 익시젠과 같은 특화된 성능을 보입니다.
엑사원 3.0은 13개의 벤치마크 평가에서 메타의 라마3.1, 구글의 젬마2 등과 같은 동일 크기 글로벌 오픈소스 AI 모델과의 비교에서 1위를 차지하였습니다. 이는 LG가 개발한 모델의 글로벌 경쟁력을 입증하는 중요한 지표가 되었습니다. 엑사원 3.0은 특허, 소프트웨어 코드, 수학, 화학 등 분야에서 6000만 건 이상의 데이터를 학습하여 성능을 극대화하였고, 연내에는 법률, 바이오, 의료 등으로 학습 데이터를 1억 건 이상으로 확장할 계획입니다.
엑사원 3.0은 LG 그룹의 계열사 제품과 서비스에 본격적으로 도입될 예정입니다. 각 계열사는 고유 데이터로 엑사원 3.0을 최적화하여 사업의 특성에 맞게 적용함으로써 혁신 속도를 높이고 있습니다. 배경훈 LG AI연구원장은 특화된 성능과 경제성을 갖춘 엑사원 3.0을 통해 외부 기업及기관과의 긴밀한 파트너십을 강화해 나갈 계획임을 밝혔습니다. 이러한 조치는 실제 산업 현장에 적용 가능한 AI 모델을 개발하기 위한 지속적인 노력의 일환입니다.
LG AI연구원이 자체 개발한 AI 모델 ‘엑사원 3.0’을 국내 최초로 오픈소스로 공개하였습니다. 엑사원 3.0은 LG가 2021년 12월 발표한 엑사원 1.0, 이어서 2023년 7월 공개한 엑사원 2.0에 이어 발표된 모델로 계속해서 성능이 개선되고 있습니다. 오픈소스로 공개된 이 모델은 AI 연구 생태계 발전에 기여하기 위한 취지로 개발된 경량 모델입니다. 이는 AI 모델이나 소프트웨어의 개발 소스코드를 공개하는 방식으로, 연구자들이 이를 바탕으로 직접 수정하고 응용할 수 있는 기회를 제공합니다. 특히, LG는 2026년까지 AI·데이터 연구개발에 3조6000억원을 투입할 계획이며, 이를 통해 LG의 혁신과 새로운 고객 경험 창출을 목표로 하고 있습니다.
LG AI연구원은 ‘챗엑사원’이라는 AI 비서 서비스를 올 하반기부터 LG 그룹의 전 계열사에 제공할 예정입니다. 이 서비스는 실시간 웹 정보 기반 질의응답, 문서 및 이미지 기반 질의응답, 코딩, 데이터베이스 관리 등의 다양한 기능을 제공하여 사용자들의 업무 효율성을 높이는 데 기여할 것으로 기대됩니다. 특히, 챗엑사원은 검색증강생성(RAG) 기술을 활용하여 임직원이 입력한 지시문의 맥락을 파악하고 최신 정보를 반영한 답변을 제공하여 실용성을 높이고 있습니다. 올해 말까지 베타 서비스를 시행할 계획이며, 사용자들의 피드백을 반영하여 업데이트를 지속할 예정입니다.
엑사원 3.0은 LG 계열사와 협력하여 제품과 서비스에 적용될 예정입니다. LG AI연구원은 연말까지 법률, 바이오, 의료, 교육, 외국어 등 다양한 분야의 데이터로 학습 데이터 양을 1억 건 이상으로 늘릴 계획이며, 이로 인해 엑사원 3.0의 성능을 끌어올릴 계획을 세우고 있습니다. 각 LG 계열사는 자사가 보유한 데이터를 활용하여 엑사원 3.0을 최적화하고, 이에 따라 사업 및 서비스 혁신을 가속화할 것입니다. 이를 통해 LG는 AI 산업 내 경쟁력을 더욱 확장해 나갈 것으로 보입니다.
LG AI연구원이 공개한 엑사원 3.0은 메타의 라마3.1, 구글의 젬마2와 비교하여 뛰어난 성능을 보여줍니다. 엑사원 3.0은 이전 모델인 엑사원 2.0에 비해 추론 처리 시간은 56% 감소하고, 메모리 사용량은 35% 줄어들었으며, 구동 비용은 72% 절감되었습니다. 이로 인해 엑사원 3.0은 실제 사용성을 포함한 13개 벤치마크 점수에서 1위를 차지하는 성과를 거두었습니다.
엑사원 3.0은 한국어 성능에 특화된 모델로, 국내 학계와 연구소에서의 활용도를 높이는 데 중점을 두고 개발되었습니다. 또한 영어로도 기능을 제공하는 바이 링구얼 모델로 설계되어 글로벌 확장성을 갖추고 있습니다. LG AI연구원은 이를 통해 한국어 기반의 생성형 AI 생태계를 확장해 나갈 계획입니다.
LG AI연구원은 엑사원 3.0을 기반으로 향후 법률, 바이오, 의료, 교육, 외국어 분야로 학습 데이터를 확대할 계획이며, 연내에 학습 데이터 양을 1억건 이상으로 증가시키겠다고 밝혔습니다. 이를 위해 LG 계열사들은 보유 데이터를 활용하여 엑사원 3.0을 최적화하고 특화된 응용을 발전시킬 예정입니다.
엑사원 3.0의 출시는 LG AI연구원이 오픈소스 AI 생태계에 전략적으로 기여하며 글로벌 시장에서의 입지를 강화하는 주요 계기가 되고 있습니다. 엑사원 3.0의 성능과 경제성은 메타, 구글과 같은 글로벌 AI 기업들과 비교했을 때 상당한 경쟁력을 보이며, 특히 한국어 특화된 기능은 국내 AI 발전에 중요하게 작용하고 있습니다. 챗엑사원 서비스는 이러한 모델을 기반으로 LG 그룹 전반에 걸쳐 업무 효율성을 높이는 데 기여할 전망입니다. 물론, 엑사원 3.0의 한계를 극복하기 위한 지속적인 데이터 확장이 필요하고, 앞으로 법률, 바이오, 의료 분야로의 학습 데이터 확대가 예정되어 있는 점은 긍정적입니다. 이 과정에서 LG AI연구원이 AI 산업을 선도하는 위치에 오르게 될 가능성이 높습니다.
LG AI연구원이 개발한 초거대 대규모언어모델(LLM)로, 성능과 경제성을 높인 오픈소스 AI 모델입니다. 한국어 성능에서 세계 최고를 기록하며, 연구 생태계 발전에 기여하고 있습니다.
엑사원 3.0을 기반으로 한 AI 에이전트 서비스로, 검색증강생성(RAG) 기술을 통해 사용자의 질의에 대한 최신 정보를 제공하며, 다양한 업무에 AI의 활용을 돕고 있습니다.
LG그룹 산하의 인공지능 연구기관으로, 엑사원 시리즈 등 AI 모델의 연구 및 개발을 통해 LG의 AI 생태계 확장에 기여하고 있습니다.