네모트론-4-미니: 소형 언어 모델 혁신

일반 리포트 2024년 12월 01일

1. 요약

본 리포트는 엔비디아가 개발한 힌디어 전용 소형 언어 모델 '네모트론-4-미니-힌디-4B'의 개발 목적과 기술적 특성을 분석합니다. 이 모델은 40억 개의 파라미터로 구축되어 힌디어 사용자를 위한 최적화된 AI 솔루션을 제공합니다. 엔비디아는 네모 큐레이터와 래피즈 라이브러리를 통해 데이터 처리 효율성을 강화하고, AI 서비스의 정확성을 높였습니다. 이 모델은 교육, 소매, 의료 등 다양한 산업 분야에서의 활용성을 제공하며, 인도와 같은 다국어 환경에서 특히 중요한 역할을 하고 있습니다. 네모트론-4-미니-힌디-4B는 인도의 디지털 전환을 지원하며 다국어 AI 모델의 가능성을 확장하는 데 기여하고 있습니다. 이와 함께, 현지 기업인 테크 마힌드라, 사르밤 AI, 지나니닷에이아이 등이 이 모델을 통해 맞춤형 서비스를 강화하고 있습니다.

2. 엔비디아의 네모트론-4-미니-힌디-4B 모델

2-1. 모델 개요 및 파라미터 수

엔비디아의 힌디어 전용 소형 언어 모델인 네모트론-4-미니-힌디-4B는 40억 개의 파라미터를 보유하고 있습니다. 이 모델은 엔비디아가 개발한 150억 개의 파라미터를 가진 다국어 언어 모델인 네모트론-4 15B에서 파생되었습니다. 네모트론 모델은 생성형 AI 개발을 위한 엔드투엔드 클라우드 네이티브 프레임워크인 엔비디아 네모를 사용하여 힌디어 및 영어 데이터를 조합해 훈련되었습니다.

2-2. 기술적 기반 및 활용 기술

네모트론 모델은 엔비디아 네모 큐레이터(NeMo Curator)를 활용하여 고품질 멀티모달 데이터를 대규모로 처리하고 훈련 및 사용자 정의에 활용하여 AI 모델의 정확도를 향상시킵니다. NeMo 큐레이터는 멀티노드 GPU 시스템에서 데이터 처리 파이프라인을 가속화하기 위해 엔비디아 래피즈(RAPIDS) 라이브러리를 사용합니다. 이를 통해 합성 데이터 생성, 데이터 필터링, 분류 및 중복 제거를 위한 사전 구축된 파이프라인과 빌딩 블록이 제공됩니다. 이 모델은 NIM 마이크로서비스로 패키징되어 교육, 소매, 의료 등의 다양한 산업 분야에서 활용될 수 있도록 설계되었습니다.

2-3. AI 모델의 성능 및 벤치마크

네모로 미세 조정된 최종 모델은 여러 정확도 벤치마크에서 우수한 성능을 보여줍니다. 현재 이 모델은 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼의 일환으로 제공되며, 기업들은 AI 개발을 프로덕션 환경에 맞춰 간소화할 수 있는 기술과 보안 및 추가 리소스에 접근할 수 있습니다.

3. 힌디어 모델의 개발 배경

3-1. 인도의 다국어 환경 및 디지털화

인도는 22개 언어와 1,500개 이상의 언어가 사용되는 다국어 환경을 가지고 있습니다. 인도의 인구 약 10%는 영어를 사용하고 있으며, 이는 인터넷에서 가장 많이 사용되는 언어입니다. 최근 인도는 급속한 디지털화의 흐름을 겪고 있으며, 현지 기업과 스타트업들은 더 많은 인도인들이 모국어로 기술과 상호작용할 수 있도록 다국어 AI 모델을 개발하고 있습니다.

3-2. 언어 모델 개발의 필요성

현대의 비즈니스 환경에서 기업은 고객 서비스 AI 에이전트를 통해 고객과의 상호작용을 강화하고 있습니다. 엔비디아는 힌디어 사용자 수가 5억 명을 넘는 것을 감안하여 힌디어 전용 소형 언어 모델인 네모트론-4-미니-힌디-4B를 개발하게 되었습니다. 이 모델은 모국어 사용자의 요구를 충족시키기 위해 필요한 다양한 방언과 문화적 배경을 반영한 인프라를 구축하고 있습니다.

3-3. 현지 데이터 세트의 중요성

개발된 모델은 고품질 힌디어 데이터를 기반으로 하며, 생성형 AI 모델의 정확성을 향상시키기 위해 엔비디아 네모 큐레이터를 사용하여 실제 힌디어 데이터와 합성 데이터를 처리하여 훈련되었습니다. 이는 기업들이 현지화된 서비스를 제공하는 데 도움을 주며, 다양한 산업 분야에서의 적용 가능성을 높이고 있습니다.

4. 기업 활용 사례

4-1. 테크 마힌드라의 인더스 2.0 모델

테크 마힌드라는 힌디어와 수십 개의 방언에 초점을 맞춘 AI 모델인 인더스 2.0을 개발하기 위해 엔비디아의 네모트론 힌디 NIM 마이크로서비스를 최초로 사용하였습니다. 인더스 2.0은 테크 마힌드라의 고품질 미세 조정 데이터를 활용하여 모델의 정확도를 높임으로써 은행, 교육, 의료 및 기타 산업 분야의 고객에게 현지화된 서비스를 제공할 수 있는 기회를 열어줍니다.

4-2. 사르밤 AI의 다국어 LLM 개발

사르밤 AI는 인도 최초의 다국어 LLM인 사르밤 1을 개발하였습니다. 이 모델은 엔비디아 H100 텐서 코어 GPU로 구동되는 현지 AI 인프라에서 훈련되었으며, 영어, 벵골어, 마라티어, 타밀어, 텔루구어 등 인도 주요 10개 언어를 지원합니다. 사르밤 AI는 음성 대 텍스트, 텍스트 대 음성 변환, 번역 및 데이터 구문 분석 모델을 기업 고객에게 제공하고 있습니다.

4-3. 지나니닷에이아이의 음성 변환 모델

지나니닷에이아이는 다국어 음성 변환 LLM을 구축하였습니다. 이 모델은 인도와 미국 전역의 150개 이상의 은행, 보험 및 금융 서비스 회사에서 매일 약 천만 건의 실시간 음성 상호작용을 처리하는 AI 고객 서비스 비서를 지원합니다. 이 모델은 14개 언어를 지원하며, 엔비디아 호퍼 GPU와 네모 프레임워크를 사용하여 1,400만 시간 이상의 대화 음성 데이터를 기반으로 훈련되었습니다.

5. 엔비디아의 기술적 접근 방식

5-1. NVIDIA NeMo 및 데이터 처리 파이프라인

엔비디아의 힌디어 전용 소형 언어 모델 ‘네모트론-4-미니-힌디-4B’는 40억 개의 파라미터를 기반으로 개발되었습니다. 이 모델은 엔비디아에서 개발한 150억 개의 파라미터를 가진 다국어 언어 모델인 네모트론-4 15B에서 파생되었습니다. 이 모델은 엔드투엔드 클라우드 네이티브 프레임워크이자 마이크로서비스 제품군인 NVIDIA NeMo를 사용하여 개발되었습니다. 이를 통해 실제 힌디어 데이터, 합성 힌디어 데이터와 동일한 양의 영어 데이터를 조합해 정제와 추출, 훈련을 수행하였습니다. 이 데이터 세트는 고품질 멀티모달 데이터를 대규모로 처리하여 생성형 AI 모델의 정확도를 향상시키는 NVIDIA NeMo Curator로 제작되었습니다. NeMo Curator는 멀티노드 GPU 시스템에서 데이터 처리 파이프라인을 가속화하여 처리 시간과 총소유비용을 낮추기 위해 NVIDIA RAPIDS 라이브러리를 사용하였습니다.

5-2. AI Enterprise 소프트웨어 플랫폼

네모트론-4-미니-힌디-4B 모델은 NVIDIA AI Enterprise 소프트웨어 플랫폼의 일환으로 제공됩니다. 이를 통해 기업은 AI 개발을 프로덕션 환경에 맞춰 간소화할 수 있는 기술과 기업 수준의 보안을 비롯한 추가 리소스에 접근할 수 있습니다. 이 모델은 NIM 마이크로서비스로 패키징되어 교육, 소매, 의료 등 다양한 산업 분야의 사용 사례를 지원하는 데 쉽게 활용될 수 있습니다.

5-3. 고품질 데이터 처리 기술

NVIDIA는 고품질 데이터를 처리하기 위해 합성 데이터 생성, 데이터 필터링, 분류 및 중복 제거를 위한 사전 구축된 파이프라인과 빌딩 블록을 제공합니다. 이 최종 모델은 최대 80억 개의 파라미터를 가진 AI 모델에 대한 여러 정확도 벤치마크에서 우수한 성능을 나타내고 있습니다. 또한, 엔비디아 인셉션 프로그램에 참여한 기업들은 여러 인도 언어에 대한 AI 모델을 개발하는 데 NVIDIA NeMo를 사용하고 있습니다.

결론

엔비디아의 '네모트론-4-미니-힌디-4B'는 인도의 디지털 및 다국어 환경에서 중요한 AI 모델로 자리잡고 있습니다. 이 모델은 지역의 다양한 언어적, 문화적 요구를 충족시키며 현지 고객 서비스 AI 솔루션의 품질을 높이는 역할을 하고 있습니다. 주요 발견으로는 네모트론 모델의 기술적 우수성과 인도 시장에서의 활용 가능성을 들 수 있으며, 이는 엔비디아의 AI 기술 발전 방향을 잘 보여줍니다. 그러나 이 모델은 아직 특정 언어에 제한적이며 더 많은 언어와 방언을 포함하기 위한 발전이 필요합니다. 향후 다양한 언어 지원 확대와 더불어 다른 지역으로의 확장이 이루어진다면, 글로벌 AI 시장에서 더욱 큰 의미를 가질 것입니다. 이러한 발전은 사용자의 다양한 요구를 충족시키고, AI 솔루션이 더 폭넓게 적용될 수 있는 발판이 될 것입니다.

용어집

엔비디아( NVIDIA) [회사]: 엔비디아는 GPU 및 AI 기술의 선두주자로, 다양한 산업 분야에서 사용되는 AI 모델과 솔루션을 개발하고 있습니다. 특히, 다국어 AI 모델의 개발을 통해 글로벌 시장에서의 접근성을 높이고 있으며, 현지 기업과 협력하여 맞춤형 서비스를 제공하고 있습니다.

네모트론-4-미니-힌디-4B [제품]: 히디어 전용 소형 언어 모델로, 40억 개의 파라미터를 보유하고 있으며, 생성형 AI 개발을 위한 엔드투엔드 클라우드 네이티브 프레임워크인 엔비디아 네모를 기반으로 합니다. 이 모델은 다양한 산업 분야에서 활용될 수 있도록 설계되었습니다.

출처 문서

엔비디아, 힌디어용 sLM ‘네모트론-4-미니-힌디-4B’ 공개 > 뉴스https://www.brainbox.co.kr/bbs/board.php?bo_table=news&wr_id=58694&sca=Benchmark
엔비디아, 5억 명 사용하는 힌디어용 4B sLM ‘네모트론-4-미니-힌디-4B’ 공개https://www.aitimes.kr/news/articleView.html?idxno=32562
10억 명 이상의 언어 사용자를 위한 ‘Nemotron-4-Mini-Hindi-4B’ - NVIDIA Blog Koreahttps://blogs.nvidia.co.kr/blog/llms-indian-languages/

네모트론-4-미니: 소형 언어 모델 혁신

목차

1. 요약

2. 엔비디아의 네모트론-4-미니-힌디-4B 모델

2-1. 모델 개요 및 파라미터 수

2-2. 기술적 기반 및 활용 기술

2-3. AI 모델의 성능 및 벤치마크

3. 힌디어 모델의 개발 배경

3-1. 인도의 다국어 환경 및 디지털화

3-2. 언어 모델 개발의 필요성

3-3. 현지 데이터 세트의 중요성

4. 기업 활용 사례

4-1. 테크 마힌드라의 인더스 2.0 모델

4-2. 사르밤 AI의 다국어 LLM 개발

4-3. 지나니닷에이아이의 음성 변환 모델

5. 엔비디아의 기술적 접근 방식

5-1. NVIDIA NeMo 및 데이터 처리 파이프라인

5-2. AI Enterprise 소프트웨어 플랫폼

5-3. 고품질 데이터 처리 기술

결론

용어집