요약 대규모 언어 모델(LLM)을 활용한 챗봇은 높은 잠재력을 가지고 있지만, 정보 부족과 환각 문제로 인해 제한된 답변 능력을 보이는 문제점이 존재합니다. RAG 모델과 같은 텍스트 생 성 작업을 수행하는 모델은 주어진 소스 데이터로부터 정보를 검색하고 해당 정보를 활용하 여 원하는 텍스트를 생성하는 과정을 통해 이러한 문제를 해결할 수 있습니다. 기술적 접근 1. 검색 가능한 청크 생성: 소스 데이터를 작은 단위인 청크로 분할하여 정보 검색의 기본 단위로 활용합니다. 이는 문장 또는 문단과 같은 텍스트 조각을 의미합니다. 2. 임베딩: 텍스트를 벡터 형태로 변환하는 과정을 통해, 텍스트 데이터를 수치화된 벡터로 전환합니다. 3. 벡터 데이터베이스 구축: 벡터 공간에서 각 청크의 위치를 나타내며, 검색..