检索增强生成

大模型前沿技术之一

展开2个同名词条

5有用+1

同义词RAG（大模型内化吸收知识的过程）一般指检索增强生成

检索增强生成（Retrieval-augmented Generation），简称RAG，是当下热门的大模型前沿技术之一。^[1]

检索增强生成模型结合了语言模型和信息检索技术。具体来说，当模型需要生成文本或者回答问题时，它会先从一个庞大的文档集合中检索出相关的信息，然后利用这些检索到的信息来指导文本的生成，从而提高预测的质量和准确性。^[2]

2020年，Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文。该篇论文首次提出了RAG概念。^[2]

中文名: 检索增强生成
外文名: Retrieval-augmented Generation

所属学科: 人工智能
简称: RAG

历史沿革

播报

编辑

2020年，Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文。该篇论文首次提出了RAG概念，并对该概念进行详细介绍和解释。^[2]

技术定义

播报

编辑

RAG即Retrieval-Augmented Generation，是一种结合检索和生成技术的模型。它通过引用外部知识库的信息来生成答案或内容，具有较强的可解释性和定制能力，适用于问答系统、文档生成、智能助手等多个自然语言处理任务中。RAG模型的优势在于通用性强、可实现即时的知识更新，以及通过端到端评估方法提供更高效和精准的信息服务。^[1]

图示

工作原理

播报

编辑

RAG的工作原理是通过检索大规模文档集合中的相关信息，然后利用这些信息来指导文本的生成，从而提高预测的质量和准确性。

具体而言，RAG通过三个关键部分实现工作：检索、利用和生成。在检索阶段，系统会从文档集合中检索相关信息；在利用阶段，系统会利用这些检索到的信息来填充文本或回答问题；最后在生成阶段，系统会根据检索到的知识来生成最终的文本内容。^[2]

图示

通过这一过程，RAG模型能够在各种自然语言处理任务中发挥作用，如问答系统、文档生成和自动摘要、智能助手和虚拟代理、信息检索以及知识图谱填充等。同时，RAG模型具有及时更新、解释性强、高度定制能力、安全隐私管理以及减少训练成本等优点。与微调相比，RAG是通用的，适用于多种任务，并且能够实现即时的知识更新而无需重新训练模型。^[1]

理论依据

播报

编辑

RAG模型的理论依据主要围绕在利用检索、知识填充、智能助手、信息检索、数据更新、定制能力、安全管理等方面，以提供准确、及时、解释性强、高度定制、安全保障的服务。

基于检索的知识填充和自动生成：RAG利用大规模文档集合进行检索，填充文本以生成准确的答案和内容。

智能助手和虚拟代理：RAG可用于构建智能助手或虚拟代理，通过结合聊天记录回答用户问题，提供信息和执行任务。

信息检索和知识图谱填充：RAG能改进信息检索系统，使其更准确深刻，并用于填充知识图谱中的实体关系，提高生成文本的可靠性。

数据更新及时性和解释性回复：RAG模型具备检索库的即时更新机制，回复具有强解释性，由检索库直接提供答案，用户可核实准确性。

高度定制能力和安全隐私管理：RAG可根据特定领域的知识库和prompt定制，通过限制知识库权限实现安全控制。

减少训练成本和通用性：RAG模型具有可拓展性，通过大量数据直接更新知识库，不需重新训练模型，适用于多种任务。^[2]

优势特点

播报

编辑

应用场景

1.问答系统（QA Systems）：RAG可以用于构建强大的问答系统，能够回答用户提出的各种问题。它能够通过检索大规模文档集合来提供准确的答案，无需针对每个问题进行特定训练。

2.文档生成和自动摘要（Document Generation and Automatic Summarization）：RAG可用于自动生成文章段落、文档或自动摘要，基于检索的知识来填充文本，使得生成的内容更具信息价值。

3.智能助手和虚拟代理（Intelligent Assistants and Virtual Agents）：RAG可以用于构建智能助手或虚拟代理，结合聊天记录回答用户的问题、提供信息和执行任务，无需进行特定任务微调。

4.信息检索（Information Retrieval）：RAG可以改进信息检索系统，使其更准确深刻。用户可以提出更具体的查询，不再局限于关键词匹配。

5.知识图谱填充（Knowledge Graph Population）：RAG可以用于填充知识图谱中的实体关系，通过检索文档来识别和添加新的知识点。^[2]

技术优势

1.外部知识的利用：RAG模型可以有效地利用外部知识库，它可以引用大量的信息，以提供更深入、准确且有价值的答案，这提高了生成文本的可靠性。

2.数据更新及时性：RAG模型具备检索库的更新机制，可以实现知识的即时更新，无需重新训练模型。说明RAG模型可以提供与最新信息相关的回答，高度适配要求及时性的应用。

3.回复具有解释性：由于RAG模型的答案直接来自检索库，它的回复具有很强的可解释性，减少大模型的幻觉。用户可以核实答案的准确性，从信息来源中获取支持。

4.高度定制能力：RAG模型可以根据特定领域的知识库和prompt进行定制，使其快速具备该领域的能力。说明RAG模型广泛适用于的领域和应用，比如虚拟伴侣、虚拟宠物等应用。

5.安全和隐私管理：RAG模型可以通过限制知识库的权限来实现安全控制，确保敏感信息不被泄露，提高了数据安全性。

6.减少训练成本：RAG模型在数据上具有很强的可拓展性，可以将大量数据直接更新到知识库，以实现模型的知识更新。这一过程的实现不需要重新训练模型，更经济实惠。^[2]

对比微调

接下来，通过对比RAG与微调，帮助大家根据具体的业务需求，选择合适的策略：

任务特定vs通用性：微调通常是为特定任务进行优化，而RAG是通用的，可以用于多种任务。微调对于特定任务的完成效果好，但在通用性问题上不够灵活。

知识引用vs学习：RAG模型通过引用知识库来生成答案，而微调是通过学习任务特定的数据生成答案。RAG的答案直接来自外部知识，更容易核实。

即时性vs训练：RAG模型可以实现即时的知识更新，无需重新训练，在及时性要求高的应用中占优势。微调通常需要重新训练模型，时间成本较高。

可解释性vs难以解释性：RAG的答案可解释性强，因为它们来自知识库。微调模型的内部学习可能难以解释。

定制vs通用性：RAG可以根据特定领域进行定制，而微调需要为每个任务进行特定微调，需要更多任务特定的数据。^[1-2]

词条图册更多图册

检索增强生成(1张)

词条图片(2张)

1/1

分享你的世界查看更多

RAG 技术：让 AI 从 “书呆子” 变身 “开卷小天才”！

普通 AI 是 “闭卷死背党”，但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查，还能把知识说得让你忍不住拍大腿叫好。

Alter聊科技

参考资料

1
阿里云推出企业级大模型RAG解决方案 “最强外挂”可大幅提升语言模型表现．驱动之家 [引用日期2024-05-06]
2
RAG一文读懂！概念、场景、优势、对比微调与项目代码示例．飞桨PaddlePaddle [引用日期2024-05-06]

学术论文

内容来自

陈卓. 图像检索数据库生成方法,增强现实的方法及装置．2017

查看全部

检索增强生成的概述图（1张）

分享你的世界查看更多

RAG 技术：让 AI 从 “书呆子” 变身 “开卷小天才”！

普通 AI 是 “闭卷死背党”，但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查，还能把知识说得让你忍不住拍大腿叫好。

Alter聊科技知名科技自媒体

RAG 技术：让 AI 从 “书呆子” 变身 “开卷小天才”！

普通 AI 是 “闭卷死背党”，但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查，还能把知识说得让你忍不住拍大腿叫好。

Alter聊科技知名科技自媒体

RAG 技术：让 AI 从 “书呆子” 变身 “开卷小天才”！

普通 AI 是 “闭卷死背党”，但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查，还能把知识说得让你忍不住拍大腿叫好。

Alter聊科技知名科技自媒体

词条统计

浏览次数：71636次

编辑次数：4次历史版本

检索增强生成

目录

历史沿革

技术定义

工作原理

理论依据

优势特点

应用场景

技术优势

对比微调

相关搜索