什么是RAG(检索增强生成)-知识中心-深信服

什么是RAG(检索增强生成)
RAG 的工作流程
RAG 的主要优势
RAG 的典型应用场景
RAG 应用实操教程
为您推荐

什么是RAG(检索增强生成)

RAG（Retrieval - Augmented Generation，检索增强生成）一种用于提升大型语言模型性能的架构或技术框架，特别是在需要事实准确性、时效性和领域知识的任务上。RAG 的核心逻辑是：让模型在生成回答前，先从外部知识库中检索相关信息，再基于检索到的内容生成回答，从而实现 “用最新、最准确的知识增强生成能力”。

RAG 的工作流程

1. 检索阶段：

当用户提出一个问题或请求时，RAG 系统首先会分析这个输入（查询）。
系统利用这个查询，去一个外部知识库中搜索最相关的信息片段。这个知识库可以是：海量文档（PDF, Word, 网页等）、数据库、维基百科、公司内部的私有知识库/文档库、实时更新的新闻源等等。
检索的目标是找到与用户查询语义上最相关、最有信息量的文档片段（通常是文本段落或句子）。

2. 增强生成阶段：

检索到的相关文档片段（通常称为“上下文”或“参考”）被拼接到原始的用户查询中。这个“增强后”的提示（用户查询 + 检索到的上下文）被输入给大型语言模型(LLM)。LLM 的任务是基于这个包含了最新、特定、相关外部知识的完整提示来生成最终的答案。

LLM 在生成答案时，会综合利用

①它自身在预训练阶段学到的通用知识

②检索阶段提供的、与当前问题高度相关的具体信息。

RAG 的主要优势

1. 提高事实准确性：答案基于检索到的可靠信息，显著减少 LLM 的“幻觉”。

2. 知识更新及时：通过更新外部知识库（如添加最新报告、新闻），系统就能提供最新信息，无需重新训练昂贵的 LLM。

3. 融入特定领域知识：可以轻松接入私有或专业领域的知识库，让通用 LLM 具备特定领域的专业能力。

4. 可解释性增强：系统可以（也应该）提供其答案所依据的检索到的文档片段作为参考来源，增加透明度和可信度。

5. 成本效益：相比于针对特定任务或知识领域微调整个 LLM，RAG 是一种更轻量级、更灵活的解决方案。

RAG 的典型应用场景

智能问答系统：回答需要基于特定文档集（如产品手册、公司政策、研究论文）的问题。
聊天机器人：提供更准确、有依据的客户支持或信息咨询。
内容摘要：基于检索到的相关文档生成更准确、全面的摘要。
研究报告辅助：帮助研究人员查找相关文献并综合信息。
企业知识管理：让员工能快速查询公司内部文档、流程、项目信息等。
基于事实的写作辅助：帮助撰写需要引用来源的报告、文章等。

RAG 应用实操教程

AI应用回答不准确？手把手教你精准优化 RAG 应用

为您推荐

什么是数字孪生

什么是模型蒸馏

什么是AI数据标注

什么是RAG(检索增强生成)