Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >检索增强生成RAG的关键特性与优势

检索增强生成RAG的关键特性与优势

原创
作者头像
走向未来
发布于 2025-04-21 07:06:03
发布于 2025-04-21 07:06:03
1.6K0
举报

什么是检索增强生成呢?在灯塔书《知识增强大模型》一书的第四章《检索增强生成》中这样介绍“检索增强生成(Retrieval Augmented Generation,RAG)通过检索外部知识(如文档、知识图谱、数据库等)提升大模型知识的准确性、时效性及推理能力,从而缓解“幻觉”现象,解决知识老化问题。RAG 的核心理念在于通过提供可靠的知识资源,使大模型在生成答案时更加全面、可信和可靠。这类似于人类记忆的运作机制。人类的记忆往往并不精确,会随着时间的推移变得模糊;同理,大模型也无法精确地保存知识。人类通过翻阅书籍或使用搜索引擎找到可靠的知识源,验证知识的准确性;同理,RAG 也利用外部知识来补充和更新知识,解决不准确、不及时和不可靠的问题,从根本上弥合知识鸿沟。”关于检索增强生成有关的技术,涉及到向量数据库、向量检索和文本检索以及RAG本身的实战,可以阅读灯塔书《知识增强大模型》。本文则进一步探讨RAG的关键特性,深入理解,为什么大模型需要利用外部知识来解决不准确、不可靠和不及时的问题,进而实现可信人工智能。

1. 访问实时和最新的知识

RAG依赖于外部知识库,以便在生成响应之前检索实时且相关的信息 。这与LLM受限于特定时间和数据集的训练形成鲜明对比 。RAG允许响应基于当前和补充数据,而不是仅仅依赖于模型的训练集 。开发人员可以利用RAG将LLM直接连接到实时社交媒体、新闻网站或其他频繁更新的信息源 。这一特性对于需要最新信息的应用至关重要,例如实时客户支持、旅行规划或理赔处理,通过使用实时数据扩展了这些应用的潜力。例如,在客户支持中,RAG系统可以快速检索准确的产品规格或故障排除指南,帮助用户高效地解决问题,从而提升用户体验和信任度 。

RAG能够利用实时数据流,这标志着LLM与世界互动方式的范式转变,使其能够超越静态知识,实现动态的、实时的理解。传统的LLM在一个特定的时间点接受训练,其知识库是固定的。RAG打破了这个限制,引入了一种机制,可以从不断发展的数字环境中获取和整合信息。对于那些对时效性和准确性要求极高的应用,例如金融分析、新闻报道和客户服务而言,这种能力尤其有价值,在这些领域,获取最新数据能够显著提升人工智能输出的质量和相关性。

确保生成响应的上下文相关性

RAG通过复杂的检索算法从海量数据中识别最相关的文档或片段,从而提供与用户查询高度契合的上下文丰富回答。这是通过复杂的检索算法实现的,这些算法能够从庞大且分散的数据集中识别出最相关的文档或数据片段 ,这些算法通常有向量检索(参考灯塔书《知识增强大模型》第3章《向量数据库》、第4章《检索增强生成》以及第8章《图模互补应用范式》、第9章《知识图谱增强生成与GraphRAG》等)。语义搜索作为RAG的一个组成部分,超越了关键词匹配,能够理解问题和源文档的含义,从而检索到更准确的结果 。RAG系统通过使用上下文信息,使AI系统能够生成针对用户特定需求和偏好的定制化响应 。

RAG检索算法的精密度标志着人工智能从仅仅处理关键词到理解用户意图的转变,从而实现了更具意义和准确性的互动。上下文相关性是有效沟通的关键。RAG先进的检索算法,包括语义搜索,使其能够超越表面的关键词匹配,深入研究用户查询的潜在含义。这种能力使得RAG能够识别和检索不仅准确而且直接适用于用户特定情境和需求的知识,从而产生更有帮助和更令人满意的AI驱动的互动。

减少幻觉生成:基于事实的生成

RAG通过控制信息流,平衡检索事实与生成内容,最大限度地减少虚构信息。许多RAG实现支持透明来源标注(引用检索内容),这对于负责任的AI实践至关重要,并提升了用户信任,也符合监管要求。RAG通过将LLM的响应建立在外部、可验证的事实基础上,减少了模型自行捏造信息的可能性。透明的来源标注不仅提高了用户对AI生成内容的信任度,也使得信息的准确性可以被核实,这在法律、医疗保健和金融等高风险领域尤为重要。

RAG在减轻幻觉方面的多方面方法,结合了受控的信息访问与确保事实一致性的技术,强调了构建更可靠和值得信赖的AI系统的承诺。LLM产生不准确或误导性信息的问题对AI的广泛应用构成了重大挑战。RAG通过确保LLM的响应以外部、可验证的信息为基础,直接应对了这一问题。此外,来源标注功能增强了AI输出的透明度,允许用户追溯信息的来源并验证其准确性,这对于在各个领域建立和维持对AI系统的信任至关重要。

实现成本效益:避免昂贵的模型再训练

RAG允许企业利用现有数据和知识库,无需对LLM进行大规模重新训练 。RAG通过使用相关检索数据增强模型输入,而不是要求模型从头开始学习,从而实现了这一点。这种方法显著降低了与开发和维护AI系统相关的成本,使得组织能够更快、更高效地部署RAG应用,而无需在专有数据上大量投资于大型模型的训练。与重新训练LLM相比,RAG提供了一种更经济高效的方式来引入新数据。

RAG的经济优势,特别是避免了耗时且昂贵的模型再训练,使得更广泛的企业能够利用先进的AI技术,而无需承担通常与定制AI模型相关的巨额费用。通过允许组织利用其现有的数据资产,RAG降低了进入门槛,使得各种规模的企业都能部署强大的AI驱动的应用程序,从而提高效率和创新。

另一方面,即使在不训练的情况下,某些大模型支持百万级词元(token)的输入,此时使用RAG,能够减少上下文,进而减少计算的成本。

提升用户生产力:快速获取精准数据

RAG通过结合信息检索与生成式AI,帮助用户快速获取精准的上下文相关数据。例如,在客户支持场景中,RAG系统可以快速检索相关信息,帮助用户高效解决问题。RAG通过提供准确且具有上下文敏感性的响应,减少了用户在数据收集和分析上花费的时间,使决策者能够专注于可操作的见解,并使团队能够自动化耗时的任务。RAG能够快速检索和综合信息,这有助于研究人员更高效地工作。

RAG通过提供对精确和上下文相关数据的快速访问,显著提高了用户的工作效率,从而减少了信息搜索和处理所花费的时间,并使个人和团队能够专注于更具战略性和创造性的任务。通过将高效的信息检索与LLM的生成能力相结合,RAG充当了一个强大的工具,可以加速知识工作者的工作流程并提高整体生产力。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
检索增强生成机理探寻:为什么要RAG?
RAG系列文章的核心观点来自于“灯塔书”《知识增强大模型》第4章《检索增强生成》的内容,这些内容是对书中内容进行补充和概览。书中以45页的篇幅详细介绍了RAG的概念、理论、构建RAG系统的流程,基于DIfy开源框架构建RAG系统的实战、关于RAG的最佳实践指南以及其他一些主流的可以用于构建RAG系统框架的介绍等等。内容非常丰富,实例可以立即上手,思考题可以引导启发,适合于教学和自学。
走向未来
2025/04/27
6510
什么是检索增强生成 (RAG)?简单易懂,一文说清其组成和作用原理
人工智能一直在帮助企业处理各种事务,从简单的客户查询到复杂的问题解决。然而,即使是最先进的人工智能模型有时也会有不足之处,提供的答案也不太准确。
DenserAI_Chris
2024/09/15
1.6K0
什么是检索增强生成 (RAG)?简单易懂,一文说清其组成和作用原理
RAG科普文!检索增强生成的技术全景解析
增强生成 (RAG) 是塑造应用生成式 AI 格局的关键技术。Lewis 等人在其开创性论文中提出了一个新概念面向知识密集型 NLP 任务的检索增强生成之后,RAG 迅速成为基石,提高了大型语言模型 (LLM) 输出的可靠性和可信度。
致Great
2025/02/15
9680
RAG科普文!检索增强生成的技术全景解析
干货!带你了解7种检索增强生成 (RAG) 技术
在简单RAG中,大型语言模型(LLM)接收用户查询,在向量存储库中进行相似性搜索或在知识图谱中进行关系搜索,然后基于检索到的信息生成答案。
致Great
2025/01/06
5.8K0
干货!带你了解7种检索增强生成 (RAG) 技术
检索增强生成RAG与微调大模型的比较,大模型应用方案的终极选择指南
大模型(LLM)或者生成式人工智能(GenAI)正在迅速重塑各个行业,在内容创作和解决问题方面展现出卓越的能力。然而,这些人工智能模型的真正力量和可靠性在很大程度上取决于它们访问、处理和利用数据的方式。为了提升它们的性能并确保所提供信息的准确性和相关性,出现了两种主要技术:检索增强生成(RAG)和模型微调(SFT)。
走向未来
2025/04/27
2580
检索增强生成(RAG):大模型的‘外挂知识库
想象一下,你正在参加一场考试,但这次考试允许你“开卷”。你不仅可以从书本中找到答案,还能灵活运用这些知识来回答问题。这就是RAG技术的魅力所在!传统的生成式AI(如ChatGPT)只能依赖“脑子里存的东西”(训练好的模型参数),而RAG则像一位“开卷小天才”,既能查资料,又能灵活作答。它结合了信息检索与生成式大模型的双重优势,让AI的回答更精准、更实时。那么,RAG究竟是如何工作的?它又能为我们的生活带来哪些改变?让我们一探究竟!
一只牛博
2025/05/31
2090
检索增强生成(RAG):大模型的‘外挂知识库
检索增强生成:革命性技术还是过度承诺?
本文将深入剖析 RAG(Retrieval-Augmented Generation)所宣称的能力和其在实际应用中的表现。我们首先将探讨 RAG 的工作原理,评估其潜在的优势。随后,我们将分享在实践中遇到的一些挑战,以及我们为应对这些挑战所开发的解决方案。此外,我们还将讨论那些我们仍在探索中的未解决的问题。通过这些内容,您将获得对 RAG 能力的全面了解,并认识到它在推动人工智能领域发展中所扮演的不断进化的角色。
深度学习与Python
2024/06/27
1740
检索增强生成:革命性技术还是过度承诺?
同济大学发布最新检索增强(RAG)的LLM生成技术综述
摘要主要介绍了大型语言模型(LLMs)在实际应用中面临的挑战,比如幻觉、知识更新缓慢和答案缺乏透明度等问题,并提出了检索增强生成(Retrieval-Augmented Generation,RAG)作为一种解决方案。RAG通过从外部知识库检索相关信息来辅助大型语言模型回答问题,已经被证明能显著提高回答的准确性,减少模型产生的幻觉,尤其是在知识密集型任务中。
唐国梁Tommy
2023/12/21
17.2K0
同济大学发布最新检索增强(RAG)的LLM生成技术综述
检索增强生成 (RAG) 的 5 大 提示词,非常实用!
从去年到现在,检索增强生成(RAG)这套玩法越来越火。简单来说,它就是让大型语言模型(LLM)结合外部数据,确保回答更准确、不胡说八道(减少“幻觉”)。这样一来,RAG 系统不仅能给出更靠谱的答案,还能紧跟最新信息。
致Great
2025/03/15
6650
检索增强生成 (RAG) 的 5 大 提示词,非常实用!
生成AI中最新的RAG方法,优缺点
近年来,人工智能技术取得了长足的进步,尤其是生成式人工智能取得了令人瞩目的进展。 IDC 研究显示,生成式 AI 市场规模预计将在 2022 年达到 107 亿美元,2026 年达到 326 亿美元。然而,生成式人工智能在其输出的质量、准确性和可靠性方面仍有改进的空间。引起关注的是检索增强生成(RAG)。 RAG是一种从外部知识源获取相关信息以提高生成式AI性能的技术。
致Great
2025/01/25
3300
Retrieval Augmented Generation (RAG) 研究报告
近年来,大型语言模型 (LLM) 在自然语言处理领域取得了显著的进展,展现出强大的文本生成能力。然而,LLM 仍然存在一些局限性,例如容易产生“幻觉”(生成不准确或不相关的信息,类似于人类的“虚构”)、知识库更新不及时,以及在面对特定领域问题时提供过时或过于泛化的信息 。Retrieval Augmented Generation (RAG) 是一种新兴的技术,它将信息检索系统与生成式 LLM 相结合,旨在克服这些局限性,增强 LLM 的能力。  
@小森
2025/02/24
5580
检索增强生成(RAG)
检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了检索机制和生成模型的先进技术,旨在提高自然语言处理系统的准确性和上下文相关性。本文将详细介绍如何从零开始构建一个RAG系统,包括数据处理、检索、生成以及部署等各个环节。
@小森
2025/01/03
4610
RAG 2.0架构详解:构建端到端检索增强生成系统
关于检索增强生成(RAG)的文章已经有很多了,如果我们能创建出可训练的检索器,或者说整个RAG可以像微调大型语言模型(LLM)那样定制化的话,那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调,就像一个缝合怪一样,虽然能够工作但各部分并不和谐,所以我们这里介绍RAG 2.0的概念来解决这个问题。
deephub
2024/04/26
2.1K0
RAG 2.0架构详解:构建端到端检索增强生成系统
深入解析 RAG:检索增强生成的原理与应用
RAG 是“检索增强生成”(Retrieval-Augmented Generation)的简称,简单来说,就是一种让 AI 更聪明的方法。它把“找资料”和“写答案”两件事结合起来。怎么做到的呢?
码事漫谈
2025/03/11
9760
深入解析 RAG:检索增强生成的原理与应用
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
在刚刚过去的首届 OpenAI 开发者大会上,OpenAI 不仅公布了新的 GPT-4 Turbo 模型,还推出了多项对现有功能的升级和融合,一系列新产品和新功能的发布让外界大呼过瘾。虽然其中重要内容很多,但一条具有革命性意义的消息让人很难不注意到:OpenAI消除在某些用例中对纯向量数据库的需求。换言之,OpenAI 将提供一款 Retrieval 检索工具,用户已无需创建或搜索向量。
深度学习与Python
2023/11/10
1.9K0
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
让 AI 更智能的检索增强生成(Retrieval-Augmented Generation)
RAG 技术的实现依赖于多种关键技术的协同工作,这些技术涵盖了从数据检索到生成的全过程。以下是 RAG 的关键技术栈的详细介绍:
码事漫谈
2025/03/26
3130
让 AI 更智能的检索增强生成(Retrieval-Augmented Generation)
检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?
Github地址:https://github.com/CraftJarvis/RAT
致Great
2025/01/05
3460
检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?
一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)
针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。
ShuYini
2023/12/21
42.1K79
一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
首先,我们将 RAG 工作流程分为三个部分,以增强我们对 RAG 的理解,并优化每个部分以提高整体性能:
致Great
2025/02/22
1.2K0
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
RAG系统:大模型驱动的实时信息检索革新
RAG系统正逐步革新我们对AI驱动信息处理的认知。为充分发挥其潜力,理解其基本原理至关重要。本文旨在简明扼要地解析RAG系统,期望为读者提供洞见与共鸣。
AI浩
2024/12/30
3250
RAG系统:大模型驱动的实时信息检索革新
推荐阅读
相关推荐
检索增强生成机理探寻:为什么要RAG?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档