Your browser does not support JavaScript!

대형 언어 모델과 RAG 기술 분석

일일 보고서 2024년 09월 24일
goover

목차

  1. 요약
  2. LLM 대형 언어 모델 동향
  3. RAG 검색 증강 생성 기술의 개요
  4. LLM과 RAG의 상호작용 및 융합 기술
  5. RAG 기술의 최신 트렌드와 신기술
  6. 기업의 생성형 AI 활용 사례
  7. Goover와 AutoRAG 기술 비교
  8. 결론

1. 요약

  • 이 리포트는 대형 언어 모델(LLM)과 검색 증강 생성(RAG) 기술의 최근 동향과 이들 간의 상호작용을 분석합니다. LLM의 정의와 발전, 환각 문제와 해결 방안, RAG 기술의 기본 개념과 주요 응용 사례 등을 다룹니다. 또한 LLM과 RAG 융합으로 인한 혁신 사례를 소개하며 두 기술이 상호 보완적으로 작용하는 방식을 설명합니다. 이외에도 기업들이 생성형 AI를 어떠한 비즈니스 부문에서 활용하고 있는지, RAG 기술의 최신 트렌드와 신기술, 그리고 Goover와 AutoRAG 기술의 비교 등을 구체적으로 다룹니다.

2. LLM 대형 언어 모델 동향

  • 2-1. LLM의 정의와 기본 개념

  • 대형 언어 모델(LLM)은 자연어 처리(NLP) 작업을 수행하는 데 사용되는 인공지능 모델로, 대량의 텍스트 데이터를 학습하여 언어의 구조와 의미를 이해하고 생성하는 능력을 갖고 있습니다. 이러한 모델들은 텍스트 생성, 번역, 요약 등 다양한 언어 처리 작업에서 뛰어난 성능을 발휘하며, 점차 일상 생활 속으로 깊숙이 침투하고 있습니다. LLM의 발전은 인공지능 분야에서 중대한 도약을 이뤄냈으며, 특히 어텐션 메커니즘에 기반한 트랜스포머 아키텍처 덕분에 가능해졌습니다. 그러나 LLM은 가끔 예기치 않은 오류를 내거나, 모델의 환각(Hallucination)을 일으키는 경우가 있습니다.

  • 2-2. LLM 기술의 최근 발전

  • 최근 LLM의 발전은 여러 가지 논문과 연구 결과를 통해 드러나고 있습니다. 예를 들어, 'Llama 3' 및 'Mixtral 8x22B'와 같은 모델들은 기존의 LLM보다 성능이 향상된 것으로 보고되었습니다. Llama 3는 Gemma 7B 및 Mistral 7B Instruct를 초월하는 성능을 보여주며, Mixtral 8x22B는 높은 성능/비용 비율로 추론, 지식 검색 등에서 강력한 성과를 나타냈습니다. RAG(검색 증강 생성)의 적용 또한 많이 이루어지고 있으며, 이를 통해 LLM의 환각 문제를 해결하고 보다 정확하고 신뢰성 있는 출력이 가능해지고 있습니다.

  • 2-3. LLM 환각 문제 및 해결 방안

  • LLM에서 발생하는 환각 문제는 모델이 실제 데이터와 일치하지 않는 정보를 생성하는 현상을 지칭합니다. 환각은 모델의 파라미터가 충분하지 않거나 특정 도메인에 대한 학습 부족에서 자주 발생합니다. 이를 해결하기 위해, 많은 연구에서는 LLM의 성능 향상을 위한 다양한 접근 방법들이 제시되고 있습니다. 프롬프트 엔지니어링, 검색 증강 생성(RAG) 기술의 도입이 대표적이며, 고급 RAG 기법을 통해 LLM의 성능을 향상시키려는 노력이 계속되고 있습니다.

3. RAG 검색 증강 생성 기술의 개요

  • 3-1. RAG의 정의와 기본 개념

  • RAG(검색 증강 생성, Retrieval-augmented Generation)는 도메인별 데이터를 통합하여 생성형 AI 시스템의 응답을 정보에 근거하고 정확히 맞춤화할 수 있도록 해주는 기술입니다. 2020년에 처음 소개된 RAG는 사전 학습된 리트리버와 사전 학습된 생성기를 결합한 end-to-end 접근 방식으로 개발되었습니다. RAG는 외부 지식 소스에서 얻은 추가 정보를 LLM에 통합하여 답변의 품질을 개선하고, LLM의 환각 현상을 줄여줍니다. RAG는 인덱싱, 청크화 및 벡터화를 통하여 정보를 처리하여, 다양한 비즈니스 분야에서의 적용을 가능하게 합니다.

  • 3-2. RAG 기술의 발전 방향

  • RAG 기술은 지속적으로 진화하고 있으며, 검색 증강 사고(retrieval-augmented thoughts, RAT)와 RAG-증강 추론(RAG-augmented reasoning, RAGAR)과 같은 최신 접근 방식을 포함합니다. RAT는 RAG와 사고 과정 시뮬레이션(CoT)을 결합하여 관련 정보를 검색하고 논리적으로 추론하는 능력을 강화합니다. RAGAR은 멀티모달 입력 처리 기능을 확장하여 시각 정보와 텍스트 정보를 함께 처리할 수 있도록 발전하였습니다. 이러한 변화는 RAG를 차세대 엔터프라이즈 AI 솔루션의 핵심으로 자리잡게 하고 있습니다.

  • 3-3. RAG의 주요 응용 사례

  • RAG는 기업의 여러 비즈니스 부문에서 유용하게 활용되고 있습니다. 예를 들어, RAG는 코드 생성, 고객 서비스, 제품 설명서 작성, 엔지니어링 지원 및 내부 지식 관리 등에서 효과적으로 사용될 수 있습니다. RAG를 통해 기업은 필요한 정보를 갱신하고, 기밀 데이터를 보호하며, 적응적이고 투명한 생성형 AI 애플리케이션을 개발할 수 있습니다. 이러한 활용 사례는 RAG가 AI 기술의 혁신을 이루는 데 큰 역할을 하고 있음을 보여줍니다.

4. LLM과 RAG의 상호작용 및 융합 기술

  • 4-1. LLM과 RAG의 상호 보완적 역할

  • 대규모 언어 모델(LLM)은 주어진 질문이나 텍스트에 대한 생성적 응답을 제공하며, 다양한 도메인에서 방대한 양의 데이터를 활용합니다. 그러나 LLM은 최신 정보나 특정 도메인 지식에 대한 한계를 가지고 있으며, 이러한 문제가 발생하는 것을 환각(hallucination)이라고 합니다. 반면 RAG(Retrieval Augmented Generation)는 LLM의 이러한 한계를 보완하기 위해 개발된 기술로, 외부 지식원을 활용하여 LLM의 응답 정확성을 높입니다. RAG는 문서를 검색하고, 이 정보를 LLM에 통합하여 최신 정보와 사실적 응답을 생성하도록 도와주는 역할을 합니다.

  • 4-2. LLM-RAG 결합의 장점과 한계

  • LLM과 RAG의 결합은 LLM이 직면한 환각 문제를 극복하고, 신뢰할 수 있는 답변 생성을 가능하게 합니다. RAG는 LLM에 필요한 정보를 실시간으로 검색하여 제공함으로써, 최신 정보와 도메인 맞춤형 응답을 생성하는 데 유리합니다. 그러나 RAG의 한계는 문서 기반 정보에 제약받고 실시간으로 변하는 데이터나 동적 정보(예: 날씨, 주문 상태 등)를 제공하는 데 어려움이 있다는 점입니다. 이로 인해 RAG 단독으로는 모든 질문에 대한 정확한 응답을 제공하기에는 부족할 수 있습니다.

  • 4-3. RAG와 LLM 융합으로 인한 혁신 사례

  • RAG와 LLM의 융합은 다양한 분야에서 혁신을 가져왔습니다. 특히, 대화형 에이전트 분야에서 RAG의 활용이 두드러지며, 이 기술은 사용자 질문에 대한 정확한 답변을 제공하는 데 기여하고 있습니다. 예를 들어, 사용자가 최신 뉴스에 관한 질문을 했을 때 RAG는 관련 문서를 검색하여 LLM이 이를 바탕으로 정확하고 신뢰성 있는 정보를 제공할 수 있도록 합니다. 이러한 혁신은 기업들이 LLM과 RAG를 활용하여 효과적으로 고객 서비스를 개선하고, 전문적인 도메인 지식을 제공하는 데 큰 도움이 됩니다.

5. RAG 기술의 최신 트렌드와 신기술

  • 5-1. 반복적 RAG(Iterative RAG)

  • 반복적 RAG(Iterative RAG)는 사용자의 질문이 복잡할 경우 다양한 검색 결과를 바탕으로 추가 정보를 다시 검색하고 답변을 생성하는 기술입니다. KAIST의 김민수 교수 연구팀은 이 기술을 사용하여 기업의 의사결정 문제를 해결하는 데 최적의 방법을 도출할 수 있는 가능성을 보여주었습니다. 연구 결과에 따르면, 반복적 RAG 기술을 사용하는 경우에도 고난도 문제의 정답률은 10% 미만으로 나타났습니다. 따라서 이러한 기술은 현재까지 개발된 최신 기술로 평가받고 있습니다.

  • 5-2. 계획 RAG(Plan RAG)

  • 계획 RAG(Plan RAG)는 기존 RAG 기술과는 달리, 주어진 의사결정 문제, 데이터베이스, 비즈니스 규칙을 기반으로 어떤 데이터 분석이 필요한지를 먼저 계획한 후, 해당 계획에 따라 반복적 RAG를 이용해 미시적 차원의 분석을 수행하는 방법입니다. 이는 기업 의사결정권자가 필요한 데이터 분석을 계획하면, 그 계획에 따라 데이터 분석팀이 데이터베이스 솔루션을 사용해 분석하는 형태와 유사하지만, 거대언어모델이 이를 수행하게 됩니다. 김민수 교수는 이 기술을 통해 기업들이 복잡한 비즈니스 상황에서 최적의 의사결정을 내릴 수 있기를 기대하고 있습니다.

  • 5-3. Graph RAG 기술

  • Graph RAG(Retrieval-Augmented Generation)는 지식 그래프와 대규모 언어 모델(LLM)의 결합을 통해 더욱 지능적인 검색 결과를 제공하는 기술입니다. 이 기술은 기존 검색 엔진의 한계를 극복하고, 롱테일 쿼리나 전문 도메인에서 사용자의 복잡하고 미묘한 요구 사항을 충족할 수 있도록 설계되었습니다. Graph RAG는 검색 증강 생성(RAG) 기술의 발전형으로, 사용자 요청에 대해 외부 소스에서 관련 정보를 검색하고, 이를 기반으로 보다 정확하고 상황에 맞는 응답을 생성하는 데 기여하고 있습니다. 이를 통해 기업들은 정보 과부하 상황에서도 저렴한 비용으로 스마트하고 정확한 검색 결과를 얻을 수 있습니다.

6. 기업의 생성형 AI 활용 사례

  • 6-1. 마케팅 및 세일즈 부문

  • 최근 조사에 따르면, 미국 기업들은 생성형 인공지능(AI)을 주로 마케팅 및 세일즈 부문에서 활발히 활용하고 있습니다. McKinsey & Company의 보고서에 의하면, 전체 응답자의 34%가 마케팅 및 세일즈에서 생성형 AI를 지속적으로 활용하고 있으며, 그중 16%는 콘텐츠 제공을 목적으로, 15%는 맞춤형 마케팅을 위해 생성형 AI를 이용하고 있습니다. 생성형 AI는 고객의 관심사, 선호도, 행동에 기반하여 개인화된 메시지를 생성할 수 있어, 브랜드 광고, 슬로건, 소셜 미디어 게시물 및 제품 설명의 초안을 빠르고 일관되게 작성할 수 있습니다.

  • 6-2. 제품 및 서비스 개발 분야

  • 제품 및 서비스 개발 부문에서도 생성형 AI의 활용이 두드러집니다. McKinsey의 조사에 따르면, 전체 응답자 중 23%가 이 분야에서 생성형 AI를 이용하고 있으며, 이는 기업들이 신제품 개발 및 과정 개선을 위해 AI 기술을 적극 도입하고 있음을 나타냅니다. 생성형 AI는 자료 생성의 효율성을 높이고, 제품의 품질 향상에 기여하여 기업의 경쟁력을 높이고 있습니다.

  • 6-3. 고객 관계 관리 및 지원 시스템

  • 생성형 AI는 고객 관계 관리(CRM) 및 지원 시스템에서도 활용되고 있습니다. 예를 들어, 자산 관리 회사들은 고객 확보를 위해 생성형 AI를 시범 도입하고 있으며, 개인정보 보호 규정 내에서 외부 소스를 통합하여 고객 정보를 효율적으로 업데이트하는 도구를 개발하고 있습니다. 또, 생성형 AI는 제안 요청서(RFP)의 작성 및 수정을 지원하는 진일보한 기능을 제공하며, 고객 전환율을 크게 향상시키는 데 기여할 것으로 예상됩니다.

7. Goover와 AutoRAG 기술 비교

  • 7-1. AutoRAG 기술 개요

  • AutoRAG(자동 검색 증강 생성) 기술은 대규모 데이터 검색과 자연어 처리 기술을 결합하여 사용자가 입력한 질문에 대해 검색된 데이터를 기반으로 자동으로 생성된 응답을 제공하는 기술입니다. 이 기술은 사용자가 원하는 정보를 보다 빠르고 정확하게 찾을 수 있도록 지원하며, 대형 언어 모델(LLM)의 도움을 받아 고도화된 질의 응답 기능을 제공합니다.

  • 7-2. Goover 서비스 개요

  • Goover(구버)는 솔트룩스의 생성형 AI 검색 서비스로, 2024년 3일 한국과 미국에서 동시 공개되었습니다. 이 서비스는 전 세계 웹에서 맞춤형 정보를 검색하고, 이를 바탕으로 자동 생성된 심층 리포트를 제공합니다. Goover의 핵심 기능인 '애스크 구버(Ask Goover)'는 솔트룩스의 '루시아(Luxia)'와 같은 LLM과 그래프 검색 증강 생성(Graph RAG) 기술을 활용하여, 사용자가 필요로 하는 최적의 답변과 정보 출처를 신속하게 제공합니다. 또한, 사용자는 '브리핑 페이지'를 통해 관심 있는 주제에 대한 정보를 모니터링하고 분석할 수 있습니다.

  • 7-3. 두 기술의 주요 차이점

  • AutoRAG 기술은 자동으로 데이터를 검색하고 응답을 생성하는 데 초점을 맞추고 있으며, Goover는 이러한 기능을 기반으로 한 구체적인 서비스입니다. Goover는 전 세계 언어로 정보를 탐색하여 사용자가 필요로 하는 맞춤형 응답을 제공하는 동시에, 심층적인 리포트 생성 기능을 포함하고 있습니다. 또한, Goover는 AI 기반 브리핑 페이지를 통해 사용자가 지속적으로 관심 있는 주제에 대한 정보를 자동으로 추적 및 모니터링할 수 있도록 지원합니다.

8. 결론

  • 본 리포트는 LLM과 RAG 기술의 융합이 인공지능 분야에서 새로운 가능성을 열어주었음을 강조합니다. LLM은 대규모 텍스트 데이터를 학습하여 자연어를 생성하고 이해하는 능력을 가지고 있으며, RAG는 외부 데이터 소스를 통합하여 LLM의 응답 정확성을 높이는 데 기여합니다. RAG 기술의 발전은 LLM이 직면한 환각 문제를 해결하는데 중요한 역할을 하고 있으며, 이를 통해 더욱 신뢰할 수 있는 답변을 제공합니다. 기업들이 생성형 AI를 마케팅, 세일즈, 제품 개발, 고객 관계 관리 등 다양한 비즈니스 영역에서 혁신적으로 활용하고 있다는 점도 강조되었습니다. 마지막으로, Goover와 AutoRAG 기술의 비교를 통해 두 기술의 주요 차이점과 실제 응용 사례를 명확히 하였습니다. 앞으로도 이러한 기술들이 지속적으로 발전하며 다양한 산업에 걸쳐 적용될 전망입니다.

9. 용어집

  • 9-1. LLM [기술]

  • 대형 언어 모델은 대규모의 텍스트 데이터를 학습하여 자연어를 처리하고 생성하는 인공지능 모델입니다. 주로 문맥에 맞는 텍스트 생성, 질문 응답, 요약 등의 기능을 수행하며, 최근 다양한 산업에 걸쳐 널리 활용되고 있습니다.

  • 9-2. RAG [기술]

  • 검색 증강 생성 기술은 외부 데이터 소스에서 정보를 검색하여 LLM이 보다 정확하고 신뢰할 수 있는 답변을 제공할 수 있도록 지원합니다. 이는 특히 최신 정보 및 특정 도메인별 요구에 맞는 데이터를 통합하는 데 강점을 가지고 있습니다.

  • 9-3. Goover [서비스]

  • 솔트룩스가 개발한 초거대 AI 검색 서비스로, 사용자의 질문에 대해 신속하고 일관된 답변을 제공하며, 맞춤형 정보를 기반으로 자동 생성된 심층 리포트도 제공합니다. 이는 Graph RAG 기술과 LLM을 결합하여 신뢰성 높은 검색 결과를 제공합니다.

  • 9-4. AutoRAG [기술]

  • RAG의 자동화된 형태로, 사용자가 질문할 때마다 최적의 데이터를 자동으로 검색하고 이를 기반으로 정확하고 신뢰성 높은 답변을 생성합니다. 의료, 법률, 비즈니스 의사결정 분야 등 다양한 응용 분야에서 활용됩니다.

10. 출처 문서