这是用户在 2024-12-13 16:20 为 https://baike.baidu.com/item/%E6%A3%80%E7%B4%A2%E5%A2%9E%E5%BC%BA%E7%94%9F%E6%88%90/64380539?fromtit... 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?

检索增强生成

大模型前沿技术之一
展开2个同名词条
一分钟了解检索增强生成
01:22
RAG:当下大模型应用落地的必杀技
02:23
收藏
5有用+1
2
同义词RAG(大模型内化吸收知识的过程)一般指检索增强生成
检索增强生成(Retrieval-augmented Generation),简称RAG,是当下热门的大模型前沿技术之一。 [1]
检索增强生成模型结合了语言模型和信息检索技术。具体来说,当模型需要生成文本或者回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成,从而提高预测的质量和准确性。 [2]
2020年,Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文。该篇论文首次提出了RAG概念。 [2]
中文名
检索增强生成
外文名
Retrieval-augmented Generation
所属学科
人工智能
简    称
RAG

历史沿革

播报
编辑
2020年,Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文。该篇论文首次提出了RAG概念,并对该概念进行详细介绍和解释。 [2]

技术定义

播报
编辑
RAG即Retrieval-Augmented Generation,是一种结合检索和生成技术的模型。它通过引用外部知识库的信息来生成答案或内容,具有较强的可解释性和定制能力,适用于问答系统、文档生成、智能助手等多个自然语言处理任务中。RAG模型的优势在于通用性强、可实现即时的知识更新,以及通过端到端评估方法提供更高效和精准的信息服务。 [1]
图示

工作原理

播报
编辑
RAG的工作原理是通过检索大规模文档集合中的相关信息,然后利用这些信息来指导文本的生成,从而提高预测的质量和准确性。
具体而言,RAG通过三个关键部分实现工作:检索、利用和生成。在检索阶段,系统会从文档集合中检索相关信息;在利用阶段,系统会利用这些检索到的信息来填充文本或回答问题;最后在生成阶段,系统会根据检索到的知识来生成最终的文本内容。 [2]
图示
通过这一过程,RAG模型能够在各种自然语言处理任务中发挥作用,如问答系统、文档生成和自动摘要、智能助手和虚拟代理、信息检索以及知识图谱填充等。同时,RAG模型具有及时更新、解释性强、高度定制能力、安全隐私管理以及减少训练成本等优点。与微调相比,RAG是通用的,适用于多种任务,并且能够实现即时的知识更新而无需重新训练模型。 [1]

理论依据

播报
编辑
RAG模型的理论依据主要围绕在利用检索、知识填充、智能助手、信息检索、数据更新、定制能力、安全管理等方面,以提供准确、及时、解释性强、高度定制、安全保障的服务。
基于检索的知识填充和自动生成:RAG利用大规模文档集合进行检索,填充文本以生成准确的答案和内容。
智能助手和虚拟代理:RAG可用于构建智能助手或虚拟代理,通过结合聊天记录回答用户问题,提供信息和执行任务。
信息检索和知识图谱填充:RAG能改进信息检索系统,使其更准确深刻,并用于填充知识图谱中的实体关系,提高生成文本的可靠性。
数据更新及时性和解释性回复:RAG模型具备检索库的即时更新机制,回复具有强解释性,由检索库直接提供答案,用户可核实准确性。
高度定制能力和安全隐私管理:RAG可根据特定领域的知识库和prompt定制,通过限制知识库权限实现安全控制。
减少训练成本和通用性:RAG模型具有可拓展性,通过大量数据直接更新知识库,不需重新训练模型,适用于多种任务。 [2]

优势特点

播报
编辑

应用场景

1.问答系统(QA Systems):RAG可以用于构建强大的问答系统,能够回答用户提出的各种问题。它能够通过检索大规模文档集合来提供准确的答案,无需针对每个问题进行特定训练。
2.文档生成和自动摘要(Document Generation and Automatic Summarization):RAG可用于自动生成文章段落、文档或自动摘要,基于检索的知识来填充文本,使得生成的内容更具信息价值。
3.智能助手和虚拟代理(Intelligent Assistants and Virtual Agents):RAG可以用于构建智能助手或虚拟代理,结合聊天记录回答用户的问题、提供信息和执行任务,无需进行特定任务微调。
4.信息检索(Information Retrieval):RAG可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。
5.知识图谱填充(Knowledge Graph Population):RAG可以用于填充知识图谱中的实体关系,通过检索文档来识别和添加新的知识点。 [2]

技术优势

1.外部知识的利用:RAG模型可以有效地利用外部知识库,它可以引用大量的信息,以提供更深入、准确且有价值的答案,这提高了生成文本的可靠性。
2.数据更新及时性:RAG模型具备检索库的更新机制,可以实现知识的即时更新,无需重新训练模型。说明RAG模型可以提供与最新信息相关的回答,高度适配要求及时性的应用。
3.回复具有解释性:由于RAG模型的答案直接来自检索库,它的回复具有很强的可解释性,减少大模型的幻觉。用户可以核实答案的准确性,从信息来源中获取支持。
4.高度定制能力:RAG模型可以根据特定领域的知识库和prompt进行定制,使其快速具备该领域的能力。说明RAG模型广泛适用于的领域和应用,比如虚拟伴侣、虚拟宠物等应用。
5.安全和隐私管理:RAG模型可以通过限制知识库的权限来实现安全控制,确保敏感信息不被泄露,提高了数据安全性。
6.减少训练成本:RAG模型在数据上具有很强的可拓展性,可以将大量数据直接更新到知识库,以实现模型的知识更新。这一过程的实现不需要重新训练模型,更经济实惠。 [2]

对比微调

接下来,通过对比RAG与微调,帮助大家根据具体的业务需求,选择合适的策略:
任务特定vs通用性:微调通常是为特定任务进行优化,而RAG是通用的,可以用于多种任务。微调对于特定任务的完成效果好,但在通用性问题上不够灵活。
知识引用vs学习:RAG模型通过引用知识库来生成答案,而微调是通过学习任务特定的数据生成答案。RAG的答案直接来自外部知识,更容易核实。
即时性vs训练:RAG模型可以实现即时的知识更新,无需重新训练,在及时性要求高的应用中占优势。微调通常需要重新训练模型,时间成本较高。
可解释性vs难以解释性:RAG的答案可解释性强,因为它们来自知识库。微调模型的内部学习可能难以解释。
定制vs通用性:RAG可以根据特定领域进行定制,而微调需要为每个任务进行特定微调,需要更多任务特定的数据。 [1-2]
分享你的世界查看更多
1
RAG 技术:让 AI 从 “书呆子” 变身 “开卷小天才”!
普通 AI 是 “闭卷死背党”,但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查,还能把知识说得让你忍不住拍大腿叫好。
Alter聊科技
检索增强生成的概述图(1张)
分享你的世界查看更多
RAG 技术:让 AI 从 “书呆子” 变身 “开卷小天才”!
普通 AI 是 “闭卷死背党”,但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查,还能把知识说得让你忍不住拍大腿叫好。
Alter聊科技知名科技自媒体
RAG 技术:让 AI 从 “书呆子” 变身 “开卷小天才”!
普通 AI 是 “闭卷死背党”,但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查,还能把知识说得让你忍不住拍大腿叫好。
Alter聊科技知名科技自媒体
RAG 技术:让 AI 从 “书呆子” 变身 “开卷小天才”!
普通 AI 是 “闭卷死背党”,但 RAG 就是 “开卷活学王”。而且 RAG 可不只是会查,还能把知识说得让你忍不住拍大腿叫好。
Alter聊科技知名科技自媒体
词条统计
浏览次数:71636次
编辑次数:4次历史版本
最近更新:(2024-06-21)
图片
检索增强生成
选择朗读音色
成熟女声
成熟女声
成熟男声
成熟男声
磁性男声
磁性男声
年轻女声
年轻女声
情感男声
情感男声
0
0
2x
1.5x
1.25x
1x
0.75x
0.5x
分享到微信朋友圈