Your browser does not support JavaScript!

Graph RAG: 기술 동향과 기업 연구 사례

일일 보고서 2024년 07월 12일
goover

목차

  1. 요약
  2. 그래프 RAG 개요
  3. 주요 연구 동향
  4. 기업별 연구 및 적용 사례
  5. Graph RAG의 미래
  6. 결론

1. 요약

  • 이 리포트는 최근 검색 기술인 Graph RAG(검색 증강 생성)가 다양한 기업과 산업에서 어떻게 활용되고 있는지를 탐구합니다. Graph RAG의 기본 개념과 기술적 특성, 주요 동향을 설명하며, 삼성SDS, AWS코리아, 구글, 네이버클라우드, Toggle 등의 실제 사례를 통해 활용 방법을 분석했습니다. Graph RAG는 지식 그래프를 통해 더 정확하고 상황에 맞는 데이터를 제공하며, 기업의 데이터 검색 및 활용을 혁신시키는 중요한 기술로 자리잡고 있습니다.

2. 그래프 RAG 개요

  • 2-1. Graph RAG 정의

  • Graph RAG는 입력 지식 그래프를 활용하여 상황에 맞는 데이터에 액세스함으로써 정보에 입각한 응답을 생성하는 기술입니다. 지식 그래프는 노드와 에지라는 두 가지 주요 구성 요소로 구성됩니다. 노드는 사람, 장소, 사물 또는 개념과 같은 개별 개체를 나타내고, 에지는 이러한 노드 간의 관계를 나타냅니다.

  • 2-2. Graph RAG 구조: 노드와 에지

  • Graph RAG의 지식 그래프는 노드와 에지라는 두 가지 구성 요소로 이루어져 있습니다. 노드는 개별 개체를 나타내고, 에지는 이러한 노드 간의 관계를 나타내며 상호 연결되는 방식을 설명합니다. 이러한 구조는 LLM이 정확하고 상황에 맞는 데이터를 액세스할 수 있도록 돕습니다.

  • 2-3. 기술적 특성 및 장점

  • Graph RAG는 몇 가지 주요 기술적 특성과 장점을 제공합니다. 첫째, 상황별 이해를 향상시킵니다. 지식 그래프는 다양한 관계와 연결을 포착하여 더 깊은 이해를 제공합니다. 둘째, 추론 및 추론 능력을 향상시키며, 지식 그래프의 상호 연결된 특성 덕분에 복잡한 관계 추론이 가능합니다. 셋째, 확장성과 효율성을 제공합니다. 대용량 데이터를 효율적으로 처리할 수 있으며, 도메인 적응성이 뛰어나 특정 도메인에 맞게 지식 그래프를 커스터마이징할 수 있습니다. 마지막으로, 의료, 금융, 엔지니어링 등의 전문 도메인에서도 뛰어난 성능을 발휘합니다.

3. 주요 연구 동향

  • 3-1. 그래프 임베딩

  • 그래프 임베딩은 노드와 엣지로 구성된 지식 그래프의 구조적 표현을 벡터로 변환하는 기술을 의미합니다. 이를 통해 그래프 데이터베이스에서의 검색 및 데이터 활용을 더욱 효율적으로 수행할 수 있습니다. 주요 그래프 데이터베이스 제품에는 Ontotext, 성운 그래프, 네오포제이가 있으며, 이러한 제품들은 지식 그래프의 생성 및 관리를 용이하게 합니다. 예를 들어, NebulaGraph의 Graph RAG 기술은 지식 그래프와 대형 언어 모델(LLM)을 통합하여 보다 지능적이고 정확한 검색 결과를 제공한다고 언급되었습니다.

  • 3-2. 그래프 신경망(GNN)

  • 그래프 신경망(GNN)은 그래프의 노드와 엣지를 활용하여 데이터를 학습하는 딥러닝 모델을 의미합니다. GNN은 노드 간의 복잡한 관계를 학습하고, 이를 통해 향상된 추론 및 추론 능력을 제공합니다. 이는 특히 복잡한 관계를 파악해야 하는 과학 연구, 법률 분석, 정보 수집 등의 분야에서 유용합니다.

  • 3-3. 그래프 생성

  • 그래프 생성은 지식 그래프의 생성 및 관리를 위한 기술을 포함합니다. 지식 그래프는 풍부하고 구조화된 정보 표현을 제공하며, 도메인별 온톨로지 및 분류법을 통합하여 특정 도메인에 맞게 맞춤화될 수 있습니다. 이러한 도메인 적응성 덕분에 Graph RAG는 정확한 검색 및 이해를 위해 도메인별 지식이 중요한 의료, 금융, 엔지니어링 분야에서 뛰어난 성능을 발휘할 수 있습니다. Graph RAG는 상황별 이해와 추론 능력을 향상시키고, 대용량 데이터의 효율적인 검색 및 처리도 가능하게 합니다.

4. 기업별 연구 및 적용 사례

  • 4-1. 삼성SDS: 특허 동향 보고서 자동 생성 및 문서 검색

  • 삼성SDS는 생성형 AI 서비스를 구성하여 사내 업무 시스템과 외부 LLM을 연계하는 기능을 제공합니다. 이러한 서비스는 통합 포털과 인증 및 권한 관리 기능을 포함하여 기업의 보안을 위한 필터링 기능과 사내 업무 시스템 데이터와의 연계를 포함합니다. 데이터 모듈은 정형 및 비정형 데이터를 수집하고 전처리하여 벡터화하는 과정을 지원하며, 학습 모듈은 모델의 사전 학습과 파인튜닝을 포함한 선순환 구조를 지원합니다. 삼성SDS의 FabriX 플랫폼은 플러그인, RAG, LLM, 문서, 지식 자산 등을 카탈로그 형태로 모아 쉽고 간편하게 기업의 업무 시스템에 연계할 수 있도록 지원합니다.

  • 4-2. AWS코리아: 부모-자식 문서 세분화 및 미세조정

  • AWS코리아는 부모-자식 문서 세분화와 모델 미세 조정을 통해 RAG 기술을 활용해왔습니다. 이 접근 방식은 특히 대규모 데이터 셋을 관리하고 정제하는 데 효과적이며, 이를 통해 높은 정확도와 신속한 검색 결과를 제공할 수 있습니다. AWS는 RAG 기술을 통해 기업들이 데이터 기반 의사결정을 개선하고 효율성을 높일 수 있도록 지원합니다.

  • 4-3. 구글: 그래프 신경망-Transformer(GNT)

  • 구글은 그래프 신경망-Transformer(GNT) 기술을 도입하여 RAG 기술을 강화하고 있습니다. 이 기술은 LLM이 더 정확하고 상황에 맞는 데이터에 액세스할 수 있도록 하여, 정보에 기반한 응답을 생성할 수 있는 능력을 향상시킵니다. 이로 인해 복잡한 관계와 연결을 포착하여 더 깊은 이해를 제공하며, 데이터의 잠재력을 최대한 활용할 수 있습니다.

  • 4-4. 네이버클라우드: HyperCLOVA X

  • 네이버클라우드는 HyperCLOVA X를 통해 RAG 기술을 활용하고 있습니다. 이 기술은 도메인별 온톨로지와 분류법을 통합하여 특정 도메인에 맞춤화될 수 있으며, 정확한 검색과 이해를 위해 도메인별 지식이 필수적인 의료, 금융, 엔지니어링 등의 전문 영역에서 뛰어난 성능을 발휘합니다.

  • 4-5. Toggle: 통합 비즈니스 앱 데이터 검색

  • Toggle은 다양한 비즈니스 앱들을 연동하여 통합 검색 기능을 제공하는 SaaS 통합 솔루션 스타트업입니다. 이 회사는 RAG 기술을 사용하여 유저의 질문 맥락을 파악하고, Gmail, Slack 등의 앱에서 데이터를 검색하여 빠르고 정확한 정보를 제공합니다. 예를 들어, 사용자가 '오늘 디자인 미팅 자료'라고 검색하면 관련된 Zoom 링크와 구글 슬라이드 링크를 결과로 제공할 수 있습니다.

5. Graph RAG의 미래

  • 5-1. 데이터 기반 의사결정 강화

  • Graph RAG(검색 증강 생성)는 데이터 기반 의사결정을 강화하는 데 중요한 역할을 합니다. 예를 들어, 기업은 RAG를 통해 대규모 데이터로부터 유용한 정보와 통찰력을 얻을 수 있습니다. AWS코리아의 아키텍트들은 문서를 부모 문서와 자식 문서로 세분화하는 PDR(Parent Document Retriever) 기법을 통한 RAG의 응용을 설명하며, 이는 보다 정확하고 관련성 높은 검색을 가능하게 한다고 언급했습니다. 이러한 방식은 Graph RAG을 통해 주요 개념들 간의 복잡한 관계를 정의하고 이를 검색에 반영함으로써 보다 정확하고 연관성 높은 정보를 제공할 수 있습니다.

  • 5-2. 자동화와 효율성 증가

  • Graph RAG는 자동화와 효율성을 증가시키는 데 기여합니다. 예를 들어, Toggle의 사례에서는 RAG 기술을 사용해 Gmail, Slack 등 다양한 비즈니스 앱들을 통합하여 데이터를 검색할 수 있게 합니다. 사용자가 '오늘 디자인 미팅 자료'를 검색하면, 오늘 미팅과 관련된 Zoom 링크 및 구글 슬라이드 링크 같은 구체적인 정보를 빠르고 정확하게 제공합니다. 이렇게 자동화된 데이터 검색 기능을 통해 비즈니스 프로세스의 효율성을 크게 향상시킬 수 있습니다.

  • 5-3. 개인 맞춤형 서비스 강화

  • Graph RAG는 개인 맞춤형 서비스 강화를 가능하게 합니다. RAG를 통해 유저의 행동과 선호를 분석하여 개인화된 서비스를 제공할 수 있습니다. 예를 들어, Toggle은 유저가 필요한 정보를 신속하게 찾아주는 RAG 기술을 통해 더 나은 사용자 경험을 제공합니다. AWS코리아의 아키텍트들은 산업별 특화 데이터를 활용한 미세조정을 통해 각 산업에 적합한 RAG 모델의 정확도를 높이는 방법을 설명합니다. 이러한 맞춤형 데이터 접근은 의료, 금융 등 다양한 분야에서 중요한 역할을 합니다.

6. 결론

  • Graph RAG 기술은 다양한 산업에서 데이터 검색과 활용의 혁신을 이끄는 중요한 기술입니다. 이 기술은 데이터 기반 의사결정 강화, 자동화와 효율성 증가, 개인 맞춤형 서비스 강화를 통해 의료, 금융, 제조업 등 다양한 분야에서 큰 성과를 보이고 있습니다. 삼성SDS, AWS코리아, 구글, 네이버클라우드, Toggle 등의 사례는 Graph RAG의 실제 적용 가능성을 보여주며, 이 기술의 발전 가능성을 시사합니다. 그러나 기술적 도전 과제와 데이터 품질 관리 등의 문제는 여전히 남아 있으며, 이를 해결하기 위해 각 산업에 특화된 데이터셋을 활용한 미세조정 및 지속적 사전학습 연구가 필요합니다. 앞으로 Graph RAG는 더 효율적이고 맞춤형 서비스를 제공할 수 있는 기술로 발전할 전망입니다.

7. 용어집

  • 7-1. Graph RAG [기술]

  • Graph RAG(검색 증강 생성)는 지식 그래프를 활용해 LLM의 검색 및 생성 능력을 향상시키는 기술입니다. 각 노드와 에지로 구성된 이 구조는 정보의 상황별 이해와 추론을 도와 보다 정확하고 효율적인 검색 결과를 제공하며, 다양한 산업 분야에서 데이터 활용도를 극대화할 수 있습니다.

  • 7-2. 삼성SDS [회사]

  • 삼성SDS는 생성형 AI와 Graph RAG 기술을 활용하여 특허 동향 보고서 자동 생성 및 내부 문서 검색 등의 비즈니스 문제를 해결하고 있습니다. 'FabriX' 플랫폼을 통해 기업의 사내 업무 시스템과 외부 LLM의 연결을 지원하고 있습니다.

  • 7-3. AWS코리아 [회사]

  • AWS코리아는 Graph RAG와 PDR(Parent Document Retriever) 기술을 통해 문서를 체계적으로 관리하고, 특정 산업에 맞게 모델을 미세조정하여 성능을 향상시키는 연구를 진행하고 있습니다. 특히 의료 분야에서 큰 성과를 보이고 있습니다.

  • 7-4. Toggle [회사]

  • Toggle은 한국의 SaaS 통합 솔루션 제공 기업으로, RAG 기술을 사용해 비즈니스 앱 통합 검색 기능을 제공하고 있습니다. 이를 통해 사용자의 질문 맥락을 이해하고, 다양한 데이터 출처에서 정확한 정보를 빠르게 검색할 수 있습니다.

8. 출처 문서