이 리포트는 한국어 성능이 뛰어난 오픈소스 대형 언어 모델(LLM)들의 최근 동향을 분석하고 있습니다. 엔씨소프트의 'Llama-VARCO LLM', 메타의 'Llama 3', 그리고 Ollama 플랫폼에서의 한국어 모델 활용에 대해 다루며, 각 모델의 특징과 성능, 활용 가능성을 정리하였습니다. 이들 모델은 주로 한국어 AI 서비스의 발전 방향 및 그 가능성을 제시하며, 엔씨소프트의 Llama-VARCO는 Logickor 벤치마크에서 1위를 기록하였고, 메타의 Llama 3는 두 언어 간의 연결성을 강화한 점에서 주목받고 있습니다. Ollama는 이러한 오픈소스 모델을 쉽게 사용할 수 있는 플랫폼으로서, 한국어 AI 응용의 확장을 도모합니다.
엔씨소프트는 2024년 9월 26일 대형 언어 모델(LLM)인 'Llama-VARCO LLM'을 공개하였습니다. 이 모델은 오픈소스 언어 모델 'Llama 3.1'을 기반으로 하여 엔씨소프트의 기술력을 더해 한국어 성능을 향상시킨 튜닝 모델입니다. Llama-VARCO LLM은 소규모이며 고성능을 지향하는 특징이 있습니다.
Llama-VARCO LLM은 한국어 LLM의 사고력을 측정하는 'Logickor' 벤치마크에서 파라미터 100억 개 이하 동급 공개 모델 중 1위의 성능을 기록하였습니다. 이는 엔씨소프트의 기술이 Llama 3.1 모델의 한국어 처리 능력을 크게 개선하였음을 보여줍니다.
Llama-VARCO LLM은 챗봇 개발, QA(품질보증), 자연어 생성 등 다양한 분야에서 활용될 수 있습니다. 이 모델은 소규모-고성능의 LLM이 필요한 기업에게 최적의 솔루션을 제공할 수 있으며, 엔씨소프트는 이를 AI 모델 공유 플랫폼인 '허깅페이스'를 통해 오픈소스로 제공할 예정입니다.
메타에서 2024년 출시한 Llama 3는 이전 버전인 Llama 2에 비해 성능이 크게 향상된 대형 언어 모델입니다. 이 모델은 두 가지 매개변수를 제공합니다: **8B** 및 **70B**. 70B 모델은 **GPT-4 보다 뛰어난 성능**을 지닌 것으로 평가되고 있습니다. Llama 3는 15T 토큰 이상의 대규모 고품질 데이터 세트에서 훈련되었으며, 다양한 언어 사용 사례에 최적화되어 있습니다. 주요 성능 강화 요소로는 효율적인 언어 인코딩, 그룹 쿼리 주의를 통한 추론 효율성 증대, 그리고 인스트럭션 튜닝 등이 있습니다.
Llama 3는 한국어-영어 이중 언어 모델로, 한국어와 영어 지식 간의 연결성을 강화하여 두 언어의 표현력을 향상시킵니다. 특히, Ollama 플랫폼을 통해 로컬에서 한글 프리트레이닝된 Llama 3 모델을 실행할 수 있는 기능을 제공하며, 이는 사용자들이 더욱 향상된 테스트 환경에서 실제 활용 가능성을 증대시키는 데 기여하고 있습니다.
Llama 3는 250GB 규모의 데이터셋으로 훈련되었습니다. 이 데이터셋은 한국어 및 영어 학습의 질을 높이는 데 기여하며, Llama 3는 다양한 최신 산업 기준으로도 다른 오픈소스 챗 모델들보다 월등한 성능을 보이고 있습니다. 모델은 LogicKor 벤치마크에서 최첨단(SOTA) 결과를 달성하며, 10B 매개변수 이하의 한국어 모델들보다 뛰어난 성능을 자랑합니다.
Ollama 플랫폼은 다양한 오픈소스 대형 언어 모델(LLM)을 쉽게 사용할 수 있도록 지원하는 플랫폼입니다. 플랫폼은 로컬 머신에서 모델을 실행할 수 있는 기능을 제공하며, 사용자들은 자신이 필요한 모델을 선택하여 직접 사용할 수 있습니다. Ollama는 특히 모델의 설치와 실행을 간편하게 만들어 주며, 사용자 친화적인 인터페이스를 통해 모델의 다양한 기능을 손쉽게 이용할 수 있도록 설계되었습니다.
Llama 3 모델은 Ollama 플랫폼을 통해 로컬 머신에서 실행할 수 있습니다. 사용자들은 Llama 3의 다양한 매개변수 모델 중에서 선택하여 실행할 수 있으며, Llama 3는 70B 및 8B 두 가지 모델을 제공합니다. 이 모델은 고품질의 대규모 데이터 세트에서 훈련되어 다국어 사용 사례에 최적화되어 있습니다. Ollama 플랫폼은 이러한 Llama 3 모델을 즉각적으로 사용할 수 있는 환경을 제공하여, 개발자들이 모델을 쉽게 통합하고 활용할 수 있도록 합니다.
Ollama 플랫폼에서 실행되는 한국어 모델은 한국어 사용자를 위한 다양한 활용 가능성을 지니고 있습니다. Llama 3 모델은 사용자들이 자주 접하는 질문들에 답하거나, 고객 서비스를 자동화하는 데 유용하게 사용할 수 있습니다. 이러한 기능은 고객 응대나 정보 제공이 필요한 분야에서 효과적일 수 있으며, 한국어를 이해하는 능력이 탁월한 만큼, 한국어 기반의 AI 서비스 확장에 기여할 수 있습니다. 한국어 모델의 성능 향상은 한국어로 제공되는 다양한 AI 서비스를 더욱 발전시키는 기반이 될 것입니다.
LLM(대형 언어 모델)은 데이터를 기반으로 학습되어 콘텐츠를 인식하고 요약, 번역, 예측, 생성할 수 있는 인공지능 모델입니다. LLM은 크게 개방형과 폐쇄형으로 구분되며, 개방형 모델은 자유롭게 수정이 가능하여 오픈소스 모델로 활용될 수 있습니다. LLaMA 등 일부 오픈소스 모델은 여전히 활용에 제약이 있어 진정한 오픈소스 모델로 판단하기에는 한계가 있습니다. 이러한 오픈소스 모델의 정의는 AI 산업 발전에 기여할 수 있으며, 개방형 모델의 성능 향상은 중요합니다.
한국어 LLM의 학습 데이터 부족 문제는 주요 과제 중 하나입니다. 예를 들어, LLaMA 모델의 경우 사전학습 데이터에 한국어가 포함되지 않아, 다양한 미세조정 기법을 적용해도 한국어 성능이 부족한 상황입니다. 이를 해결하기 위해 외국어 기반 LLM을 한국어로 미세조정하는 연구가 필요하며, QLoRA, LoRA와 같은 다양한 방법론을 통해 성능 개선을 모색해야 합니다. 또한, 각 프로젝트에서의 중복된 시도를 줄이기 위해 통일된 한국어 학습 평가 방법이 필요합니다.
한국어 LLM의 발전을 위해서는 지속적인 연구와 협업이 필요합니다. KoLlama2 프로젝트와 같은 시도가 이뤄지고 있으며, 이를 통해 한국어 능력 향상을 목표로 다양한 데이터셋과 방법론이 적용되고 있습니다. 또한, AI 기술의 혁신을 위해서는 기업과 연구기관 간의 협력이 필수적입니다. 이러한 협업은 개별적인 성과를 통합하여 한국어 AI 생태계 발전을 이끌 수 있습니다.
리포트의 주요 발견인 Llama-VARCO LLM과 Llama 3 모델의 성능 향상은 한국어 AI 서비스 확장에 큰 잠재력을 가지고 있습니다. 특히, 엔씨소프트의 Llama-VARCO는 소규모-고성능 LLM을 필요로 하는 기업들에게 최적의 솔루션을 제공하며, Logickor 벤치마크에서 동급 모델 중 최고의 성능을 기록했습니다. 메타의 Llama 3는 높은 성능과 강력한 이중 언어 지원을 통해 다양한 언어 사용 사례에 뛰어난 능력을 발휘합니다. Ollama 플랫폼은 이러한 모델들을 로컬에서 실행할 수 있게 하여, 개발자들이 효율적으로 LLM을 활용하도록 지원합니다. 그러나 한국어 데이터 부족 및 모델 학습의 어려움은 여전히 남아 있는 과제로, 지속적인 연구와 협업이 필요합니다. 미래에는 이러한 오픈소스 LLM의 정의와 활용 방안에 대한 논의가 더욱 심화되며, 이를 통해 얻어진 통찰이 한국어 AI 생태계 발전을 이끌어 줄 것입니다.
출처 문서