Your browser does not support JavaScript!

대한민국 AI 및 스타트업 생태계와 LLM 최적화 기법 현황 분석

일일 보고서 2024년 08월 10일
goover

목차

  1. 요약
  2. 대한민국 AI 및 스타트업 생태계
  3. 대규모 언어 모델(LLM)의 최적화 기법
  4. AI 반도체 시장 현황
  5. 생성형 AI와 주요 사례
  6. AI 기술의 글로벌 동향
  7. 결론

1. 요약

  • 이 리포트는 대한민국의 AI 및 스타트업 생태계와 대규모 언어 모델(LLM) 최적화 기법을 종합적으로 분석합니다. AI 기술의 발전, 주요 기업 성과, 산업별 적용 사례, 윤리적 문제, LLM의 효율적 튜닝 및 서빙 아키텍처, 반도체 시장 현황 등을 다루며, 핵심 데이터를 기반으로 현재 상태를 파악합니다. 삼성전자, 솔트룩스, 리벨리온, 퓨리오사AI, Meta AI의 LLaMA, 코난테크놀로지 등 주요 기업 및 기술들의 성과와 발전 현황을 포함하고, 각 인사이트를 도출합니다.

2. 대한민국 AI 및 스타트업 생태계

  • 2-1. AI 기술의 발전과 주요 기업 성과

  • 대한민국의 AI 시장은 2022년 기준 약 18억 3천만 달러로 평가되었으며, 2032년까지 연평균 성장률(CAGR) 27.5%를 기록할 것으로 예상됩니다. 주요 기업으로는 삼성전자, SK하이닉스, 리벨리온, 사피온, 퓨리오사AI 등이 있으며, 이들은 AI 기술 개발에 주력하고 있습니다. 삼성전자는 AI 가속기 공급을 통해 AI 반도체 산업의 주요 기업으로 자리 잡고 있으며, SK하이닉스는 고대역폭 메모리(HBM)를 생산하며 두각을 나타내고 있습니다. 또한, 리벨리온, 사피온, 퓨리오사AI 같은 팹리스 기업들도 AI 반도체 설계 분야에서 주목받고 있습니다. 다이퀘스트는 자연어 처리 및 검색 엔진 전문 기업으로 SNS 검색과 감성 분석 등의 분야에서 활발히 활동하고 있습니다.

  • 2-2. AI 기술의 산업별 적용 사례

  • 의료 분야에서는 솔트룩스가 음성 인식, 이미지 분석, 자연어 처리 능력을 갖춘 AI 모델을 통해 진단 지원 시스템을 개발하고 있으며, 뤼튼테크놀로지스는 사용자 맞춤형 AI 챗봇을 통해 의료 상담 서비스를 제공하고 있습니다. 농업 분야에서는 솔트룩스가 작물 생장 예측 및 수확 시기 최적화 솔루션을 제공하고, AI 드론 기술을 활용해 농작물 상태 모니터링 및 농약 살포를 자동화하고 있습니다. 업스테이지는 AI 기반 농업 관리 시스템을 개발하여 농부들이 실시간으로 작물 상태를 파악하고 적절한 조치를 취할 수 있도록 지원하고 있습니다.

  • 2-3. AI 반도체 및 생성형 AI 플랫폼 현황

  • 생성형 AI 기술은 최근 몇 년간 급격한 발전을 이루었으며, 뤼튼테크놀로지스는 GPT-3.5, GPT-4, PaLM2 등의 글로벌 언어 모델을 통합하여 고품질 서비스를 제공하고 있습니다. LG전자는 구글의 차세대 AI 거대언어모델(LLM)인 제미니(Gemini)를 탑재한 'LG 클로이(CLOi)' 로봇을 통해 고객의 질문에 답변하고 음성 명령으로 사진 배경 이미지를 생성하는 기능을 선보였습니다. 업스테이지는 소형 언어모델(ssLLM)인 '솔라(SOLAR)'를 개발하여 약 165만 명의 사용자를 확보했으며, 프라이빗 LLM 분야에서도 두각을 나타내고 있습니다. 솔트룩스는 2023년 9월에 생성형 초거대언어모델(LLM) '루시아GPT'를 출시하여 다양한 제품 경쟁력을 강화했습니다.

  • 2-4. 윤리적 문제 및 사회적 합의의 필요성

  • AI 기술의 발전과 함께 윤리적 문제와 사회적 합의의 중요성도 커지고 있습니다. 대규모 언어 모델(LLM)은 확률적으로 그럴듯하다고 판단되는 단어를 나열하기 때문에 실제와 다른 정보를 사실처럼 제시하는 '환각' 문제가 발생할 수 있으며, 편향성, 저작권 및 개인정보 침해, 악의적 사용 등의 이슈가 있습니다. 이러한 문제를 해결하기 위해 데이터의 윤리적 수집 방법과 개인정보 보호 방안을 AI 개발 초기 단계부터 고려해야 합니다. 이경일 솔트룩스 대표는 AI 발전과 함께 규제와 제도를 마련하고, 시스템을 기반으로 사회적 합의를 이루는 것이 중요하다고 강조했습니다. 다양한 사회적 논의를 통해 공론화를 이끌어내고, 이를 바탕으로 제도적 장치를 마련해야만 AI 기술이 긍정적으로 활용될 수 있습니다.

3. 대규모 언어 모델(LLM)의 최적화 기법

  • 3-1. LLM의 발전과 개인화된 데이터 학습

  • 대규모 언어 모델(LLM)은 수천억 개 이상의 파라미터를 포함하여 대규모 텍스트 데이터를 학습합니다. 특히 트랜스포머 아키텍처를 기반으로 하여 성능을 크게 향상시키고 있으며, GPT-3와 같은 모델은 1750억 개의 파라미터를 가지고 다양한 자연어 처리 작업에서 뛰어난 성과를 보여줍니다. 개인화된 LLM을 위해 파인튜닝과 RAG 접근 방식이 도입되어 모델 성능을 극대화하고 있습니다. 파인튜닝은 특정 작업에 맞게 모델을 미세하게 조정하는 방법으로 성능을 개선하며, RAG는 검색을 기반으로 추가 정보를 제공하여 모델의 답변 생성 능력을 향상시킵니다.

  • 3-2. 효율적 튜닝 및 서빙 아키텍처

  • LLM의 효율적인 튜닝 방법으로 Parameter Efficient Fine-tuning(PEFT)과 QLoRA가 도입되었습니다. PEFT는 모델 전체를 튜닝하지 않고도 적은 자원으로 효율적인 성능을 가능하게 하며, QLoRA는 8비트 양자화 기법을 활용하여 인메모리 로드 부담을 줄이면서도 안정적인 성능을 유지합니다. 서빙 비용 측면에서는 GPU Kernel Fusion, Early Stopping, Key/Value Caching 및 Flash Attention 등의 기법이 사용되어 서빙 비용을 절감하고 성능을 최적화하고 있습니다. 그록의 AI 칩 역시 LLM의 출력 속도를 개선하는 데 주력하고 있으며, 자체 챗봇을 통해 성능 시연을 했습니다.

  • 3-3. 책임 있는 개발과 편향 문제 해결

  • 책임 있는 LLM 개발을 위해 편향 및 독성 문제를 해결하는 것이 중요합니다. Meta AI의 LLaMA 모델은 학습 데이터에 포함된 편향을 재생산하며, 특정 벤치마크에서 독성 점수를 기록하기도 했습니다. 이를 해결하기 위해 다양한 연구가 진행 중이며, 안정성 있는 모델 성능을 유지하면서 편향 문제를 줄이고자 합니다.

  • 3-4. 벤치마크 성과 분석

  • Meta AI의 LLaMA 모델은 성능 벤치마크에서 우수한 결과를 보였습니다. LLaMA-65B는 Closed-book Question Answering 벤치마크에서 SOTA 성과를 기록하였고, Code Generation 및 Massive Multitask Language Understanding(MMLU)에서도 높은 성능을 나타냈습니다. 이는 모델 크기 대비 높은 성과를 보여, 효율적인 모델 개발 가능성을 입증했습니다.

4. AI 반도체 시장 현황

  • 4-1. 리벨리온과 퓨리오사AI의 경쟁

  • 국내 인공지능(AI) 반도체 시장에서 리벨리온과 퓨리오사AI의 경쟁이 치열합니다. 리벨리온과 사피온의 합병으로 통합 법인이 출범하며, 최종 합병비율은 2.4대 1로 결정되었습니다. 리벨리온의 기업 가치는 1조1391억원으로 평가되었으며, 사피온의 가치는 3325억원입니다. 반면, 퓨리오사AI는 최근 600억에서 최대 800억원까지 투자 유치가 진행 중이며, 이 라운드를 마치면 기업 가치는 1조원을 넘을 전망입니다. 리벨리온과 퓨리오사AI는 모두 AI 반도체 기업공개(IPO)를 앞두고 있습니다.

  • 4-2. 국내 AI 반도체 기업 현황 및 투자 동향

  • 리벨리온은 2020년에 설립된 후, KT 클라우드에 AI 반도체 '아톰'을 공급하며 주목을 받았습니다. 삼성전자로부터 HBM3E를 공급받아 차세대 AI 반도체를 개발 중이며, 사피온은 2016년 SK텔레콤에서 분사하여 X330을 공개했습니다. 퓨리오사AI는 에이수스 서버에 '워보이'를 공급하는 계약을 체결했으며, 글로벌 데이터센터와의 협업을 추진 중입니다. 주요 투자자는 SV인베스트먼트, 카카오벤처스, 미래에셋벤처투자 등이 있습니다. 퓨리오사AI는 미국 오픈AI 본사에서 레니게이드를 시연하는 등 활발한 움직임을 보이고 있습니다.

  • 4-3. 글로벌 AI 반도체 시장 동향

  • 글로벌 AI 반도체 시장에서도 리벨리온과 퓨리오사AI의 활동이 두드러집니다. 리벨리온은 IBM 데이터센터에서 품질 검증을 받는 중이며, NPU를 통한 AI 반도체 시장의 선점을 노리고 있습니다. 퓨리오사AI는 챗GPT로 유명한 오픈AI와 협업하며 엔비디아에 대항할 제품을 시연합니다. 또한, 두 기업 모두 글로벌 시장에서 인정을 받고 있으며, 독자적인 비즈니스 모델을 구축하고 있습니다.

5. 생성형 AI와 주요 사례

  • 5-1. 포스코 그룹의 생성형 AI 도입 사례

  • 포스코 그룹은 구글 클라우드와 협력해 구글 제미나이(Gemini) 1.5 모델을 도입하여 AI 기반 소재 기술 및 산업 동향 리포팅 시스템과 지식 검색 Q&A 포털을 개발했습니다. 이 시스템은 다국어 뉴스 수집∙번역, 뉴스 추천, 본문 요약, 일간∙주간 이슈 리포트 생성 및 이메일 발송 등의 기능을 통해 500명 이상의 포스코 직원들이 매일 사용하고 있습니다. 또한, 포스코는 생성형 AI 기반으로 설비 전기 관련 지식 검색 Q&A 시스템도 운영하며, 이 시스템은 멀티모달 AI와 높은 정확도를 자랑하는 RAG 기술을 통해 자료를 처리하고 있습니다.

  • 5-2. 솔트룩스의 AI 검색 엔진 '구버'

  • 솔트룩스의 AI 검색 엔진 구버(Goover)는 루시아2 거대언어모델과 그래프 검색증강생성 기술을 활용해 사용자 맞춤형 정보를 제공합니다. 구버는 2024년 7월 17일 한국과 미국에서 동시에 출시되었으며, 초기 사용자 반응은 매우 긍정적이었습니다. 구버는 맞춤형 정보 제공과 심층 리포트 생성 기능을 통해 사용자들에게 유용한 정보를 제공하며, 구독형 서비스와 광고 모델을 통해 수익을 얻고 있습니다. 주요 경쟁사로는 구글, MS Bing, 퍼플렉시티가 있으며, 솔트룩스는 NHN과의 협력을 통해 클라우드 인프라를 강화하고 있습니다.

  • 5-3. 코난테크놀로지의 생성형 AI '코난 LLM'

  • 코난테크놀로지의 코난 LLM은 2024년 6월 한국남부발전의 사내 생성형 AI 구축 사업에 도입됐으며, 보고서 생성, 번역, 요약, 자료분석, 코딩 등 다양한 기능을 제공합니다. 코난 LLM은 한국어 토큰을 다수 포함한 대규모 데이터와 20년 이상의 자연어 처리 경험을 바탕으로 개발됐습니다. 이 모델은 스마트폰, 카메라, 센서, 드론, 웨어러블 등 다양한 디바이스에 적용 가능하며, 기업들은 OND, PRO, ENT 등 다양한 모델을 선택할 수 있습니다.

6. AI 기술의 글로벌 동향

  • 6-1. Meta의 LLaMA 모델과 오픈소스 AI

  • Meta는 Llama 3.1이라는 405B 파라미터 규모의 오픈소스 AI 모델을 출시하였습니다. 이는 업계 최초로 공개된 대규모 '프론티어' 모델로, GPT-4와 같은 최고의 폐쇄형 모델들과 비교해 여러 벤치마크에서 우수한 성능을 보였습니다. 특히 연구자, 개발자, 기업들이 이 모델을 자신들의 프로젝트나 제품에 통합할 수 있는 다양한 사례가 보고되었습니다. Meta는 개발자 커뮤니티가 Llama 3.1을 효과적으로 사용할 수 있도록 문서화, 튜토리얼, 워크샵 등 다양한 교육 자료와 프로그램을 지원하고 있습니다.

  • 6-2. 엔비디아의 AI 및 클라우드 전략

  • 디노도 플랫폼은 데이터 통합과 관리 솔루션을 제공하는 글로벌 기업으로, 아마존 베드록의 대규모 언어 모델(LLM)과 원활한 통합을 제공합니다. 이를 통해 보안, 개인정보 보호, 책임감 있는 AI를 갖춘 생성AI 애플리케이션의 개발 생산성을 높일 수 있습니다. 디노도 플랫폼은 아마존 오픈서치를 벡터 데이터베이스로 활용하여 신뢰할 수 있고 관리된 데이터를 베드록 LLM에 공급합니다. 이를 통해 기업들은 AI 기반 코파일럿을 활용하여 데이터 뷰 생성과 시스템 운영을 효율적으로 진행할 수 있습니다. AWS와의 협업을 통해 디노도는 데이터 관리와 배포를 개선하며, 고객들은 안전하고 믿을 수 있는 AI 애플리케이션을 구축할 수 있게 되었습니다.

  • 6-3. 글로벌 AI 시장의 윤리적 문제

  • AI 기술의 발전에 따라 윤리적 문제도 함께 대두되고 있습니다. Meta의 Mark Zuckerberg는 오픈소스 AI가 사회에 미치는 긍정적 영향을 강조하며, AI의 민주화가 기술 접근성을 향상시키고 혁신을 가속화할 것이라고 주장했습니다. 그러나 오픈소스 AI의 잠재적 위험과 이를 관리하기 위한 보안 문제, 오용 가능성 등에 대해 논의가 필요합니다. 또한, AI 기술의 혜택이 특정 대기업에만 집중되지 않도록 광범위하게 분배되어야 하며, 이를 통해 AI에 대한 대중의 지지와 수용을 높일 수 있을 것입니다.

7. 결론

  • 본 리포트는 대한민국 AI 및 스타트업 생태계와 LLM 최적화 기법의 다양한 측면을 상세히 분석하였습니다. 주요 기업인 삼성전자와 솔트룩스의 혁신 사례, 리벨리온과 퓨리오사AI의 반도체 경쟁, Meta AI의 LLaMA 모델, 코난테크놀로지의 코난 LLM 등이 주요 발견으로 도출되었습니다. AI 기술의 윤리적 문제와 편향성 해결, 효율적인 모델 튜닝 기법(PEFT, QLoRA)의 중요성을 강조했으며, 한국과 글로벌 AI 반도체 시장의 치열한 경쟁도 중요한 포인트로 확인되었습니다. 이 보고서는 현재 상태를 파악하는 데 주요한 역할을 하며, 앞으로 연구와 데이터 업데이트를 통해 더욱 정확하고 포괄적인 분석이 필요할 것으로 보입니다. 이에 따라 지속적인 데이터 수집과 접근 방안 개선이 요구됩니다.

8. 용어집

  • 8-1. 삼성전자 [회사]

  • 삼성전자는 AI 기술 개발에 중요한 역할을 하며, 반도체 및 온디바이스 AI와 클라우드 AI를 결합한 전략을 통해 글로벌 AI 시장에서 큰 영향력을 행사하고 있습니다.

  • 8-2. 솔트룩스 [회사]

  • 솔트룩스는 AI 검색 엔진 '구버'를 개발하여 시장에 혁신적인 서비스를 제공하는 기업으로, 글로벌 시장 도전과 사용자 맞춤형 정보 제공에 주력하고 있습니다.

  • 8-3. 리벨리온 [회사]

  • 리벨리온은 AI 반도체 설계를 전문으로 하며, 사피온과의 합병을 통해 시장 경쟁력을 강화하고 IPO를 준비하고 있는 국내 주요 AI 반도체 기업입니다.

  • 8-4. 퓨리오사AI [회사]

  • 퓨리오사AI는 AI 반도체 분야에서 리벨리온과 경쟁하며, 데이터 센터에 공급될 AI 칩 '워보이'를 개발하여 글로벌 시장에서 주목받고 있습니다.

  • 8-5. Meta AI의 LLaMA [기술]

  • LLaMA는 Meta AI가 개발한 대규모 언어 모델로, 오픈소스 AI의 발전을 대표하며, 다양한 응용 분야에서 높은 성능을 발휘합니다.

  • 8-6. 코난테크놀로지 [회사]

  • 코난테크놀로지는 '코난 LLM'을 통해 생성형 AI 모델을 개발하며, 다양한 산업 분야에서 AI 기술의 적용 가능성을 확장하고 있습니다.

9. 출처 문서