본 리포트는 sLLM(소형 언어 모델)의 개발 전략과 최근 동향을 분석하여 기업들이 AI 기술을 효율적으로 활용하는 방법을 제시합니다. sLLM은 기존 대형 언어 모델 대비 변수의 수가 적어 비용 효율적이며, 다양한 애플리케이션과 통합이 용이합니다. 이를 통해 기업들은 맞춤형 모델을 구축할 수 있고, 디지털 제품과 서비스의 품질을 개선할 수 있습니다. 유니닥스는 헬스케어 분야의 sLLM 사레로서 AI를 통해 의료 분야에서 맞춤형 솔루션을 제공했습니다. SK C&C의 솔루어 LLMOps 플랫폼은 데이터 준비부터 모델 운영까지의 프로세스를 최적화하여 기업의 AI 솔루션 통합을 돕고 있으며, SK텔레콤은 Telco LLM을 통해 고객센터 지원 시스템을 구축하여 통신 서비스에 특화된 AI 기술을 선보였습니다. 이와 같은 다양한 사례 분석을 통해 기업들은 sLLM의 필요성과 실질적 사용 사례를 파악할 수 있습니다.
소형 언어 모델(sLLM)은 기존의 대형 언어 모델(LLM)에 비해 변수의 수가 60억 (6B) 내지 100억 (10B) 개로 적은 모델을 의미합니다. sLLM은 훈련을 위한 소모 비용과 시간을 줄이는 장점이 있으며, 다른 애플리케이션과의 통합이 용이합니다. 이러한 특성으로 인해 다양한 기업들이 sLLM을 활용하여 맞춤형 모델을 구축할 수 있게 되었습니다. 최근 생성AI의 수요가 증가하면서, 기업들은 빠르게 sLLM을 도입하여 디지털 제품과 서비스의 품질을 개선하고 있는 상황입니다.
sLLM은 여러 가지 이점을 제공합니다. 첫째, 기존 데이터 활용이 가능하여 맞춤형 모델 구축이 수월합니다. 둘째, 비용 효율성이 뛰어나 기업들이 초기 투자 부담을 줄이고 생성AI를 더 빠르게 도입할 수 있습니다. 셋째, 다양한 산업 분야에 특화된 모델로 확장 가능성이 높습니다. 예를 들어, 유니닥스에서는 헬스케어 분야를 위한 sLLM을 개발하였으며, 이를 기반으로 의료 분야에 특화된 AI 솔루션을 구현하고 있습니다. 유니닥스의 sLLM은 한국지능정보원(NIA)에서 제공하는 데이터 기반으로 개발되었으며, 모델의 성능은 MMLU 벤치마크에서 개선된 결과를 보여주었습니다. 이러한 sLLM의 개발은 의료, 법률, 금융 등 다양한 분야로의 사용 확장이 기대되고 있습니다.
기업의 데이터 수집 및 전처리는 sLLM 구축에서 중요한 과정입니다. SK C&C의 솔루어 LLMOps 플랫폼은 기업이 보유한 데이터를 수집하고 동시에 비정형 데이터를 전처리하여 학습용 데이터로 자동 생성하는 기능을 제공합니다. 이를 통해 사용자는 데이터 정제 작업을 손쉽게 수행할 수 있으며, 효율성을 높여 비용을 절감할 수 있습니다.
sLLM 구축 시, 기업은 특정 업무에 적합한 모델을 선택해야 합니다. SK C&C의 솔루어 LLMOps는 외부 생성형 AI 파운데이션 모델을 활용하여 빠르게 학습을 진행할 수 있는 기능을 통합하고 있습니다. 또한, 링크브릭스의 호라이즌 AI 플랫폼은 파인튜닝과 최신 기법을 통해 기업 내부 데이터를 기반으로 한 맞춤형 sLLM을 제작할 수 있는 통합 플랫폼을 제공합니다.
sLLM의 신뢰성을 높이기 위해 테스트 및 검증이 필요합니다. SK C&C의 솔루어 LLMOps는 AI 자동화 도구를 통해 환각 처리 기능과 sLLM 테스트 기능을 제공하여 모델의 신뢰성을 높입니다. 또한, 링크브릭스의 호라이즌 AI 플랫폼은 다양한 분야별 전용 sLLM을 구축한 경험을 통해 지속적인 검증을 수행하고 있습니다.
유니닥스의 사례는 헬스케어 영역에서의 소형 언어 모델(sLLM) 활용에 대한 중요한 예시입니다. 유니닥스는 AI 중심의 혁신적 솔루션을 통해 의료 분야에서 고객 요구에 맞춘 맞춤형 모델을 구축하였습니다. 이 모델은 의사소통의 효율성을 높이고, 환자 데이터 분석을 통해 더욱 정교한 진단을 지원합니다.
SK C&C는 솔루어 LLMOps 플랫폼을 통해 소형 언어 모델의 제작 및 관리 프로세스를 최적화하였습니다. 이 플랫폼은 데이터 준비, 모델 운영, 성능 모니터링을 포함해 전체 LLM 생태계를 통합하여 효과적인 AI 솔루션을 제공합니다. 이를 통해 기업들은 AI 기술을 보다 쉽게 통합하고 활용할 수 있습니다.
SK텔레콤은 Telco LLM을 활용하여 고객센터 AI 상담 업무 지원 시스템을 구축하였습니다. 이 시스템은 고객 문의에 대해 보다 정확하고 구체적인 답변을 제공하기 위해 다양한 통신 관련 데이터를 학습하여 최적화된 모델을 사용합니다. SK텔레콤은 소형 언어 모델을 기반으로 고객에게 신속하고 고품질의 서비스를 제공하며, 특히 통신 서비스에 특화된 LLM 개발로 인지도를 높이고 있습니다.
최근 한국의 AI 전문가 73명을 대상으로 진행된 조사에 따르면, 응답자의 74%가 기업의 소형 언어 모델(sLLM) 전략에 긍정적으로 평가하였습니다. 구체적으로 '동의한다'는 의견이 45.2%, '매우 동의한다'는 의견이 28.8%를 차지했습니다. 반면, '동의하지 않는다'는 의견은 11%, '매우 동의하지 않는다'는 의견은 1.3%에 불과했습니다. 이러한 결과는 국내 기업이 대규모 언어 모델(LLM) 대신 sLLM 중심의 전략으로 이동하고 있음을 보여줍니다. 이는 오픈AI, 마이크로소프트, 구글 등 미국 및 중국의 대기업들이 LLM 시장을 독점하고 있기 때문입니다. 비용이 높은 LLM 대신 상대적으로 작은 자원으로 운영 가능한 sLLM을 선택하는 것이 효과적이라는 의견이 지배적입니다. 그러나 전문가들은 자체 LLM 개발이 이루어지지 않을 경우 AI 기술 발전에 한계가 있을 수 있다고 경고하고 있습니다.
AI 전문가들은 한국 기업들이 sLLM 중심의 전략을 고수하는 것에 대해 긍정적으로 바라보면서도, LLM과 sLLM을 적절히 조화롭게 활용해야 한다고 강조했습니다. 실제로 LLM은 대규모 데이터 학습을 통해 다양한 자연어 처리 작업을 수행할 수 있는 반면, sLLM은 적은 컴퓨팅 자원과 비용으로 동일한 기능을 수행할 수 있습니다. 예로 구글의 ‘제미나이 나노’(매개변수 18억 개)와 메타의 ‘라마3’(80억 개)가 있으며, 이는 sLLM의 효율성을 입증합니다. 그러나 전문가들은 한국이 LLM 개발에 필요한 대규모 컴퓨팅 인프라 구축 및 학습에 대해 조 단위의 투자가 필요하다는 점에서, 글로벌 시장에서 경쟁력을 가지기 어려울 것이라는 진단을 내리고 있습니다.
sLLM(소형 언어 모델)은 기업들이 AI 기술을 도입하는 데 있어 혁신적인 변화를 이끌고 있습니다. 유니닥스는 헬스케어 시장에서 환자 데이터 분석을 통한 정교한 진단을, SK C&C는 솔루어 LLMOps를 통해 AI 생태계의 통합을, SK텔레콤은 Telco LLM을 통해 고객센터에 특화된 AI 서비스를 제공하며 그 효과를 입증했습니다. 그러나 자체 LLM 개발의 중요성도 무시할 수 없으며, 기업들은 LLM과 sLLM의 균형 잡힌 조화를 통해 최적의 AI 솔루션을 개발해야 할 것입니다. 이러한 전략은 AI 기술력 향상과 함께 글로벌 시장에서의 경쟁력 강화를 도모하는 것에 큰 기여를 할 것입니다. 앞으로도 AI 기술은 다양한 산업에서 핵심적인 도구로 활용될 것이며, sLLM의 효율성과 경제성을 고려하여 더욱 발전할 전망입니다. 기업들이 이러한 AI 발전을 실용적으로 적용할 수 있도록 지속적인 기술 투자가 필요합니다.
출처 문서