프로그래밍/기계학습

RAG란 무엇인가?

kugancity 2024. 11. 1. 18:39
반응형

 

 

RAG (Retrieval-Augmented Generation) 개념 설명

최근 인공지능(AI) 모델, 특히 대형 언어 모델(LLM)들은 질문에 대한 정확하고 유용한 답변을 생성하는 데 매우 유능합니다. 하지만 이 모델들이 새로운 정보를 학습하는 데는 많은 시간이 걸리며, 최신 정보에 대한 즉각적인 접근이 어렵다는 한계가 있습니다. 이러한 한계를 극복하기 위해 등장한 기술 중 하나가 RAG(Retrieval-Augmented Generation) 입니다. RAG는 검색 기능과 생성 기능을 결합하여, 최신 정보를 바탕으로 높은 품질의 응답을 생성하는 방법입니다.

 

 

 

 

RAG의 작동 원리

RAG는 크게 두 가지 주요 단계를 거쳐 작동합니다: 정보 검색(Retrieval) 단계와 텍스트 생성(Generation) 단계입니다. 이를 통해, AI 모델은 사용자 입력을 바탕으로 데이터베이스나 문서에서 관련 정보를 검색하고, 검색된 정보를 활용하여 더 정확하고 맥락에 맞는 응답을 생성합니다.

 

 

1. 정보 검색 (Retrieval)

이 단계에서는 사용자의 질문(또는 쿼리)을 바탕으로, 기존의 데이터베이스나 지식 자료에서 관련 정보를 찾아냅니다. 예를 들어, 회사 내 정책과 관련된 질문을 받았을 때, AI는 내부 문서나 매뉴얼에서 관련 내용을 검색하여 참고 자료를 확보합니다.

  • 정보 소스: 데이터베이스, 문서 저장소, 웹 크롤러 등을 통해 최신 정보나 관련성 높은 정보를 가져올 수 있습니다.
  • 유사도 검색: 검색 단계에서 사용자의 질문과 가장 유사한 문서나 데이터를 찾기 위해 벡터 임베딩(Vector Embedding)을 사용해 문서 간 유사도를 계산합니다.

 

2. 텍스트 생성 (Generation)

검색된 정보를 바탕으로 AI 모델이 응답을 생성합니다. 이때, 모델은 사용자의 질문과 함께 검색된 자료를 참고하여 더욱 정확하고 맥락에 맞는 답변을 제공합니다. 이 과정은 단순히 정보를 찾아 제공하는 것이 아니라, 검색된 자료를 조합하여 새로운 텍스트를 생성하는 방식입니다.

  • 컨텍스트 강화: 검색 단계에서 확보한 정보는 AI 모델이 응답을 생성할 때 맥락을 제공하여, 사용자 질문에 더 적합한 답변을 만들 수 있도록 돕습니다.
  • 응답 생성: 검색된 정보와 질문을 결합하여 GPT와 같은 언어 모델이 사용자의 질문에 맞는 최적의 답변을 생성합니다.

 

RAG의 장점

  1. 최신 정보 반영: AI 모델이 사전에 학습한 데이터가 아니라, 실시간으로 검색된 최신 정보를 기반으로 응답을 생성할 수 있습니다. 이를 통해 신뢰성 높은 정보를 제공할 수 있습니다.
  2. 더 나은 응답 정확성: 검색 단계에서 관련 정보를 미리 제공하므로, AI가 단독으로 생성할 때보다 응답의 정확성과 품질이 높아집니다.
  3. 다양한 응용 가능성: RAG는 다양한 도메인에서 응용이 가능하며, 예를 들어 법률, 의료, 기술 지원 등의 분야에서 최신 지식을 바탕으로 한 답변 생성이 가능합니다.

 

RAG의 응용 예시

  1. 고객 지원: 고객이 특정 제품에 대한 문제를 질문하면, RAG는 내부 문서에서 해당 제품의 최신 매뉴얼이나 문제 해결 정보를 찾아 응답에 활용할 수 있습니다.
  2. 의료 정보 제공: 환자가 특정 질병에 대해 질문할 때, RAG는 최신 연구 논문이나 의학 자료를 검색하여 최신 정보에 기반한 답변을 제공할 수 있습니다.
  3. 법률 상담: 사용자 질문에 대한 유사한 과거 판례나 법률 문서를 검색해, 이를 바탕으로 법률 상담을 지원할 수 있습니다.

 

RAG 전체 프로세스 

 

 

 

1. 사용자 입력 (Prompt + Query)

  • 사용자는 컴퓨터나 인터페이스를 통해 질문 또는 요청을 입력합니다. 이 입력이 Prompt + Query 형태로 다이어그램의 첫 번째 단계로 들어갑니다.
  • 이 Prompt + Query는 RAG 시스템에서 검색과 생성 작업의 기반이 됩니다.

2. 관련 정보 검색 (Search Relevant Information)

  • 시스템은 사용자의 질문에 대한 맥락을 제공하기 위해 관련 정보를 검색하는 단계를 수행합니다.
  • 이 검색 단계에서는 내부 데이터베이스나 문서 저장소, 지식 소스 등에서 사용자 질문과 관련된 정보를 찾습니다. 예를 들어, 법률 자문 시스템이라면 판례나 법률 조항을 검색할 수 있습니다.

3. 검색된 정보를 맥락으로 제공 (Relevant Information for Enhanced Context)

  • 검색된 정보가 사용자의 질문에 **강화된 맥락 (Enhanced Context)**을 제공하기 위해 준비됩니다.
  • 이 단계에서는 검색된 관련 정보가 AI 모델이 참고할 수 있도록 가공되어 다음 단계로 전달됩니다.

4. 강화된 맥락을 포함한 질의 (Prompt + Query + Enhanced Context)

  • 초기 Prompt + Query에 검색된 정보(Enhanced Context)가 추가된 형태로 강화된 맥락을 포함한 질의가 만들어집니다.
  • 이 질의는 AI 모델에 전달되며, 모델이 응답을 생성할 때 참조할 수 있도록 합니다. 이로 인해 응답의 정확성과 맥락 적합성이 높아집니다.

5. AI 모델의 응답 생성 (Generated Text Response)

  • 최종적으로 강화된 맥락과 함께 AI 모델이 응답을 생성합니다.
  • Large Language Model EndPoint(예: GPT와 같은 언어 모델)는 사용자의 질문과 검색된 정보를 바탕으로, 보다 정확하고 관련성 높은 응답을 제공합니다.
  • 생성된 텍스트 응답은 사용자에게 전달됩니다.

 

 

결론

RAG는 AI의 검색 기능과 생성 기능을 결합하여, 더욱 풍부하고 정확한 응답을 제공할 수 있는 강력한 기술입니다. 특히 최신 정보가 요구되거나 정확한 데이터가 필요한 분야에서 그 진가를 발휘하며, 앞으로 AI가 더욱 실용적으로 활용되는 데 중요한 역할을 할 것입니다. RAG는 단순한 질문 응답 시스템을 넘어, 실시간으로 정보를 검색하고 이를 기반으로 한 맞춤형 응답을 제공하는 지능형 시스템의 핵심으로 자리 잡고 있습니다.

 

 

 

참고 : https://aws.amazon.com/ko/what-is/retrieval-augmented-generation/

 

728x90
반응형