LG의 엑사원 3.0: 한국 오픈 소스 AI 모델의 혁신과 도전

일일 보고서 2024년 08월 21일

1. 요약

LG AI연구원이 공개한 엑사원 3.0은 한국어와 영어 이중 언어를 지원하는 오픈 소스 초거대 인공지능 모델로, 메타 라마 3.1 및 구글 젬마 2와 같은 글로벌 AI 모델에 견줄만한 성능을 자랑합니다. 엑사원 3.0은 성능 향상과 경제성 확보를 목표로 개발되었으며, 한국어 주요 영역에서 세계 최고 성능을 기록함과 동시에 사용된 데이터 량과 최적화된 모델 구조를 통해 글로벌 경쟁력을 갖추고 있습니다. 리포트는 엑사원 3.0의 개발 배경, 주요 특징, 성능 비교, 실제 적용 사례 등 다양한 주제를 체계적으로 다루고 있습니다.

2. 엑사원 3.0의 개발 배경과 목표

2-1. LG AI연구원의 설립 배경

LG AI연구원은 LG그룹의 미래 성장 동력으로 인공지능(AI)을 중시하고 이를 선도하기 위해 설립되었습니다. 구광모 LG그룹 회장은 AI의 중요성을 인지하고, 2018년 취임 후 AI 연구와 개발에 집중해왔습니다. 이러한 노력의 일환으로 2020년, LG전자를 포함한 여러 계열사가 참여하여 LG AI연구원을 설립하게 되었습니다.

2-2. 엑사원 시리즈의 발전 과정

엑사원 시리즈는 2021년 12월 처음으로 '엑사원 1.0'이 공개되면서 시작되었습니다. 이후 2022년 7월에 '엑사원 2.0'이 공개되었고, 약 1년 만인 2023년 7월에 '엑사원 3.0'이 발표되었습니다. 엑사원 시리즈는 매 버전마다 성능과 경제성을 개선하며 발전해왔습니다. 엑사원 3.0은 이전 모델 대비 추론 처리 시간이 56%, 메모리 사용량이 35% 감소했고, 구동 비용은 72% 절감되었습니다.

2-3. 엑사원 3.0의 개발 목표와 비전

엑사원 3.0의 주요 목표는 성능 향상 및 경제성을 동시에 확보하는 것이었습니다. 이를 위해 LG AI연구원은 다양한 벤치마크 테스트에서 높은 점수를 받도록 모델을 최적화하였습니다. '엑사원 3.0'은 코딩, 수학, 화학 등 전문 분야 데이터 6000만 건 이상을 학습하였으며, 이를 통해 메타와 구글과 같은 글로벌 대형 AI 모델과 경쟁할 수 있는 성능을 갖추게 되었습니다. 또한, 엑사원 3.0은 오픈 소스로 공개되어 학계와 연구 기관, 스타트업 등이 AI 기술을 활용할 수 있도록 지원하고 있습니다. 이를 통해 LG는 자사뿐만 아니라 글로벌 AI 생태계 저변을 확대하고자 하는 비전을 가지고 있습니다.

3. 엑사원 3.0의 주요 특징

3-1. 경량 모델의 오픈 소스화

LG는 엑사원 3.0의 경량 모델을 오픈 소스로 공개했습니다. 78억 개의 매개변수를 가진 이번 소형 언어 모델(sLM)은 메타의 '라마 3.1 8B', 알리바바의 '큐원 2 7B', 구글의 '젬마 2 9B', 마이크로소프트의 '파이 3 7B', 미스트랄 AI의 '미스트랄 7B' 등과 같은 글로벌 오픈 소스 모델들과 성능 면에서 비교할 때 우수함을 보였습니다. 특히 엑사원 3.0은 성능과 경제성의 균형을 맞추기 위해 경량화와 최적화에 중점을 두어 모델 크기를 초기 모델 대비 100분의 3 수준으로 줄이는 데 성공했습니다.

3-2. 성능 및 경제성 개선

LG AI연구원은 엑사원 3.0을 통해 성능과 경제성을 크게 개선했습니다. 이전 모델인 엑사원 2.0에 비해 추론 처리 시간이 56%, 메모리 사용량은 35%, 구동 비용은 72% 절감되었습니다. 또한 주요 벤치마크 점수에서 최고 성능을 기록하였으며, 코딩과 수학 영역 등에서 우수한 성과를 보여주었습니다. 엑사원 3.0은 전력 효율성을 높이기 위해 소형화와 최적화 기술 연구에 집중하였고, 이는 벤치마크 테스트에서의 우수한 결과로 입증되었습니다.

3-3. 한국어와 영어 이중 언어 모델

엑사원 3.0은 한국어와 영어를 모두 학습하고 이해할 수 있는 이중 언어 모델로, 한국어 성능에서 세계 최고를 기록했습니다. 엑사원 3.0은 6000만 건 이상의 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터를 학습한 결과, 한국어와 영어 추론에서 뛰어난 성과를 보였습니다. 특히 한국어 주요 영역에서 최고 성능을 기록하였고, 영어 추론(ARC)에서도 평균치를 기록하여 다국어 모델로서의 가능성을 보여주었습니다.

4. 글로벌 AI 모델과의 성능 비교

4-1. 메타 라마 3.1과의 비교

LG AI연구원이 발표한 '엑사원 3.0'은 메타의 '라마 3.1 8B' 모델과 비교했을 때 성능 면에서 앞서고 있습니다. 예를 들어, 엑사원 3.0은 코딩과 수학 영역 등 13개 벤치마크에서 1위를 차지하였습니다. 이는 메타 라마 3.1과의 비교에서도 높은 수준의 성능을 유지하고 있음을 보여줍니다.

4-2. 구글 젬마 2와의 비교

구글의 '젬마 2 9B' 모델과 비교했을 때, 엑사원 3.0은 추론 처리 시간과 메모리 사용량에서 많은 개선이 이루어졌습니다. 엑사원 3.0은 추론 처리 시간은 56%, 메모리 사용량은 35% 줄였고, 구동 비용은 72% 절감했습니다. 또한 경제성을 높이는 동시에 성능도 향상시켜 '젬마 2'와의 경쟁에서 우위를 점하고 있습니다.

4-3. 기타 글로벌 모델과의 비교

엑사원 3.0은 메타의 '라마 3.1 8B', 알리바바의 '큐원 2 7B', 마이크로소프트의 '파이 3 7B', 미스트랄 AI의 '미스트랄 7B' 등과 같은 글로벌 주요 오픈소스 모델들과 비교했을 때도 성능 면에서 뛰어난 결과를 보였습니다. 엑사원 3.0은 25개 벤치마크 항목 중 코딩, 수학, 화학 등 13개 항목에서 최고 성능을 기록했습니다. 특히 한국어 전 영역에서 최고의 성능을 기록하여 다국어 모델로서의 가능성을 입증하였습니다.

5. 엑사원 3.0의 실제 적용 사례

5-1. LG 계열사 제품과 서비스 적용 사례

LG AI연구원이 개발한 엑사원 3.0은 LG의 다양한 제품과 서비스에 적용되고 있습니다. LG그룹은 엑사원을 활용한 제품과 서비스 출시를 연내 본격화할 계획을 가지고 있으며, 엑사원3.0을 통해 새로운 고객경험과 혁신을 이루는 것이 목표입니다. 이를 위해 2026년까지 AI·데이터 연구개발에 3조6000억원을 투자할 예정입니다. 예를 들어, LG전자의 스마트 가전제품이나 LG CNS의 IT 서비스에 엑사원 3.0이 도입될 가능성이 큽니다.

5-2. 임직원 향 챗엑사원 서비스

LG AI연구원은 엑사원 3.0을 기반으로 한 챗엑사원 서비스를 LG그룹 임직원들에게 제공하고 있습니다. 이 서비스는 임직원들이 업무 중에 필요한 정보를 실시간으로 제공받을 수 있도록 돕고 있으며, 복잡한 질문에도 정확한 답변을 제공하는 능력을 자랑합니다. 엑사원 3.0의 이러한 활용은 내부 효율성을 높이고 업무 생산성을 크게 향상시키는 데 기여하고 있습니다.

5-3. 연구 생태계 활성화 기여

엑사원 3.0이 오픈소스로 공개됨에 따라 다양한 연구기관과 학계에서 활발한 연구와 개발이 이뤄지고 있습니다. LG AI연구원은

6. 오픈 소스로서의 엑사원 3.0

6-1. 오픈 소스화의 배경 및 의미

LG AI연구원은 엑사원 3.0을 국내 최초로 오픈소스로 공개했습니다. 이는 엑사원 모델이 오픈소스를 통해 연구 생태계에 기여하고자 한 목적으로 이루어진 것입니다. 최근 AI 업계에서 오픈소스 AI 모델이 큰 화두로 떠오르고 있으며, 대표적인 예로 메타의 라마3.1이 있습니다. LG는 AI 연구 생태계 발전을 위해 엑사원 3.0의 경량 모델을 연구목적으로 활용할 수 있도록 공개했습니다. 이로 인해 학계, 연구기관, 개인들이 엑사원을 활용할 수 있게 되었습니다.

6-2. 학계와 업계의 반응

엑사원 3.0의 오픈소스화 결정은 학계와 업계에서 매우 긍정적인 반응을 얻고 있습니다. LG AI연구원의 설명에 따르면, 이번 결정은 빠르게 발전하는 AI 기술에 대응하고, AI 연구 생태계를 활성화하기 위한 것입니다. 전문가들은 LG의 결정을 두고 '매우 잘한 일' 이라고 평가하고 있습니다. 또한 엑사원 3.0의 기술 보고서에 따르면 이전 모델에 비해 추론 처리 시간은 56%, 메모리 사용량은 35% 줄이고, 구동 비용은 72% 절감되었습니다.

6-3. 미래 확장 가능성

엑사원 3.0은 한국어와 영어를 이중으로 지원하는 AI 모델로서 한국어 성능에서 세계 최고를 기록했습니다. 앞으로 법률, 바이오, 의료, 교육, 외국어 등 다양한 분야로 데이터 학습 범위를 확장할 계획입니다. LG는 엑사원 3.0을 통해 한국어 성능 최강 AI라는 위치를 확고히 다지고, 글로벌 AI 모델들과 경쟁력을 갖추고 있습니다. 이번에 공개한 엑사원 3.0의 경량 모델은 누구나 연구 목적으로 활용할 수 있게 하였고, 이는 AI 연구 생태계의 활성화와 국가 AI 경쟁력을 높이는데 기여할 것입니다.

7. 결론

리포트 분석 결과, 엑사원 3.0은 LG AI연구원이 경량화와 최적화를 통해 개발한 결과 메타 라마 3.1 및 구글 젬마 2 등 글로벌 AI 모델과의 경쟁에서 우위를 점하고 있습니다. 구광모 회장이 주도하여 설립된 LG AI연구원은 엑사원 3.0을 통해 AI 생태계의 발전에 기여하고 있으며, 챗엑사원과 같은 내부 서비스에서도 높은 생산성을 보여주고 있습니다. 다만, 특정 분야 데이터 학습의 한계와 오직 연구목적에 국한된 오픈 소스 활용 제공은 추가 보완이 필요합니다. 미래에는 법률, 바이오, 의료 등 다양한 분야로 확장하여 더욱 발전된 AI 모델로 자리 잡을 것으로 기대됩니다. 실질적으로, 엑사원 3.0은 국내외 연구 기관과 산업계에서 큰 영향을 미치며 AI 기술을 선도하는 모델로 자리매김할 것입니다.

8. 용어집

8-1. 엑사원 3.0 [AI 모델]

LG AI연구원이 개발한 초거대 인공지능 모델로, 경량 모델을 오픈 소스로 공개하여 글로벌 AI 모델과 경쟁력을 갖춤. 한국어와 영어 이중 언어 지원 및 다양한 전문 분야 데이터 학습을 통해 뛰어난 성능을 자랑함.

8-2. LG AI연구원 [기관]

2018년 구광모 회장 취임 이후 설립된 LG그룹의 AI 연구 싱크탱크로, 엑사원 시리즈 개발을 주도하며 LG그룹의 AI 기술력을 강화하는 역할을 수행.

8-3. 챗엑사원 [AI 서비스]

엑사원 3.0 기반의 임직원용 AI 비서 서비스로, 검색, 번역, 데이터 분석, 코딩 등 다양한 업무에 활용될 수 있는 AI 솔루션 제공.

8-4. 구광모 [인물]

LG그룹 회장으로, AI 기술을 미래 성장 동력으로 점찍고 LG AI연구원을 설립하여 엑사원 시리즈 개발과 글로벌 AI 생태계 확장에 주도적인 역할을 함.

8-5. 메타 라마 3.1 [AI 모델]

메타(구 페이스북)가 개발한 오픈 소스 AI 모델로, 글로벌 AI 시장에서 엑사원 3.0의 주요 경쟁 모델 중 하나.

8-6. 구글 젬마 2 [AI 모델]

구글이 개발한 AI 모델로, 엑사원 3.0과 성능 및 경제성에서 비교되는 주요 글로벌 AI 모델 중 하나.

9. 출처 문서

LG, 7.8B 오픈 소스 모델 ‘엑사원 3.0’ 공개…”빅테크 동급 모델 성능 능가” < AI 기업 < 산업 < 기사본문 - AI타임스https://www.aitimes.com/news/articleView.html?idxno=162327
구광모 점찍은 AI… 내년부터 빛 본다https://biz.newdaily.co.kr/site/data/html/2024/08/08/2024080800110.html
LG AI연구원, 진화한 ‘엑사원3.0’ 공개...“AI+LG 본격 시동” | 중앙일보https://www.joongang.co.kr/article/25269129
AI 업계, LG ‘엑사원 3.0’에 물들다 < AI 주간브리핑 < Focus < 기사본문 - THE AIhttps://www.newstheai.com/news/articleView.html?idxno=6077
LG, 엑사원 3.0 하반기 LG 전계열 서비스에 적용 < 산업 < 기사본문 - DealSite경제TVhttps://news.dealsitetv.com/news/articleView.html?idxno=120951
“메타·구글에 안밀려요”… LG, 국내 첫 오픈소스 AI 공개 - 국민일보https://m.kmib.co.kr/view_amp.asp?arcid=1723020439
떴다! 한국어 특화된 LG AI ‘엑사원 3.0’https://www.chosun.com/economy/industry-company/2024/08/08/ZHAUASWUQZCLZOTSXWBWZHNQMI/

LG의 엑사원 3.0: 한국 오픈 소스 AI 모델의 혁신과 도전

목차

1. 요약

2. 엑사원 3.0의 개발 배경과 목표

2-1. LG AI연구원의 설립 배경

2-2. 엑사원 시리즈의 발전 과정

2-3. 엑사원 3.0의 개발 목표와 비전

3. 엑사원 3.0의 주요 특징

3-1. 경량 모델의 오픈 소스화

3-2. 성능 및 경제성 개선

3-3. 한국어와 영어 이중 언어 모델

4. 글로벌 AI 모델과의 성능 비교

4-1. 메타 라마 3.1과의 비교

4-2. 구글 젬마 2와의 비교

4-3. 기타 글로벌 모델과의 비교

5. 엑사원 3.0의 실제 적용 사례

5-1. LG 계열사 제품과 서비스 적용 사례

5-2. 임직원 향 챗엑사원 서비스

5-3. 연구 생태계 활성화 기여

6. 오픈 소스로서의 엑사원 3.0

6-1. 오픈 소스화의 배경 및 의미

6-2. 학계와 업계의 반응

6-3. 미래 확장 가능성

7. 결론

8. 용어집

8-1. 엑사원 3.0 [AI 모델]

8-2. LG AI연구원 [기관]

8-3. 챗엑사원 [AI 서비스]

8-4. 구광모 [인물]

8-5. 메타 라마 3.1 [AI 모델]

8-6. 구글 젬마 2 [AI 모델]

9. 출처 문서