搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Datawhale专栏
RAG 作者：RAG 已死，RAG 万岁！
一个具有更大上下文窗口的新模型问世，社交媒体上便会充斥着“RAG 已死”的宣言。 RAG 的初衷五年前，我在 Meta 基础人工智能研究中心（FAIR，前身为 Facebook 人工智能研究中心）的团队提出了 RAG（Retrieval-Augmented Generation，检索增强生成底线是：您同时需要长上下文 LLM 和 RAG。但既然“RAG”这个术语似乎如此具有争议性，那我们不妨这样说：我们不必非得称之为 RAG。我们可以就叫它检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢，而且极其低效，并且比使用 RAG 精准定位所需信息要昂贵得多。 RAG、微调和大型上下文窗口在 AI 中也是如此。结论我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。
30010编辑于 2025-04-24
来自专栏全栈开发工程师
【RAG】001-RAG概述
【RAG】001-RAG概述 0、整体思维导图下面的知识是基于一个视频教程结合 AI 生成的笔记，我也看了一遍，有了一些印象，但这种印象很快就会消失，知识也就消失了，为了使得知识在我的大脑中停留更长的时间补充1：RAG 基本逻辑补充2：RAG 知识库基本逻辑一、RAG 介绍 1、LLM 的主要局限性大语言模型（LLM）尽管功能强大，但仍存在以下明显的局限性：时效性问题：模型的知识在预训练后就固定了概述 1、RAG 的概念 RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了检索和生成技术的文本处理方法，主要用于提高语言模型的输出质量。 2、RAG 的工作原理 RAG 的核心工作流程包含以下步骤：知识库构建：收集和处理文档资料将文档切分为适当大小的文本块使用向量化模型将文本转换为向量并存储检索过程：接收用户查询并向量化在向量数据库中搜索相似内容获取最相关的文本片段生成过程：将检索到的相关内容与用户问题组合构建合适的提示词（Prompt）通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用
37710编辑于 2025-03-25
来自专栏机器学习原理
rag
RAG技术全面解析：原理、应用与优势引言在当今快速发展的人工智能领域，检索增强生成（Retrieval-Augmented Generation, RAG）技术已成为一个备受关注的话题。 RAG工作流程 RAG的工作流程可以分为以下几个步骤：用户查询：用户提出一个查询，系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势，这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息，RAG系统可以识别出新的实体和关系。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势，但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。
39511编辑于 2024-06-27
来自专栏自然语言处理
RAG Logger：RAG日志记录工具
您听说过 RAG Logger 吗？它是一款专为检索增强生成 (RAG) 应用程序设计的开源日志记录工具！据说它可以作为 LangSmith 的轻量级替代方案，满足 RAG 特定的日志记录需求。查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。特点通过查询跟踪详细了解用户问题！ RAG Logger 为 RAG 应用程序的性能监控和调试提供了强大的支持，对吗？特别推荐给那些想要提高应用程序开发效率的人。请参阅此处的详细信息： RAG Logger GitHub 仓库
17410编辑于 2025-01-07
来自专栏数据派THU
独家 | 进阶RAG-提升RAG效果
在我的上一篇博客中，我深入地介绍了RAG以及它是如何用LlamaIndex实现的。然而，RAG在回答问题时经常遇到许多挑战。 RAG工作流程分解首先，为了增强对RAG的理解，我们将RAG工作流程分解为三个部分，并对每个部分进行优化以提高整体表现。模块化RAG 模块化RAG集成了多种方法来增强RAG的不同组成部分，如在检索器中加入相似度检索的搜索模块和应用微调方法 RAG融合（RAG Fusion） RA融合技术结合了两种方法：多查询检索利用总结本文讨论了优化RAG管道各部分和增强整体RAG流水线的各种技术。您可以在您的RAG流水线中使用这些技术中的一种或多种，从而使其更加准确和高效。原文标题：Advance RAG- Improve RAG performance 副标题：Ultimate guide to optimise RAG pipeline from zero to advance
1K20编辑于 2024-06-28
RAG 2.0，让RAG 终成正果
然而，像Contextual.ai提出的基于情境语言模型（CLMs）的“RAG 2.0”这样的案例却很少见，它试图让目前最流行（如果不是最受欢迎的话）的生成式AI模型实现方式之一——标准检索增强生成（RAG 提出这种主张的，恰恰是RAG的创造者。虽然这是对生产级生成式AI现状的一次重大改进，但整个子领域仍存在一个疑问：RAG是否正在走向末路，这些创新是否只是在对一个已经死去的马施加无效的鞭打？这就是RAG发挥作用的地方。这个类比背后的原因是因为标准的RAG系统组装了三个不同的组件，这些组件是分别预训练的，并且根据定义，它们本来就不应该在一起。相反，RAG 2.0系统从一开始就被定义为“一体”。总的来说，我们很快就能看到处理极长序列的成本仅为现在的一小部分，这应该会增加对RAG架构需求的怀疑。当那个时刻到来时，我们可以几乎肯定它会发生，我们还会依赖RAG吗？
1.4K51编辑于 2024-04-24
来自专栏全栈开发工程师
【RAG】001.1-RAG相关核心概念
【RAG】001.1-RAG相关核心概念 RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合信息检索与生成模型的混合架构，旨在提升生成的准确性和可信度。其核心概念可归纳为以下六个方面： RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合信息检索与生成模型的混合架构，旨在提升生成的准确性和可信度。上下文融合（Context Fusion）上下文融合是指将检索到的知识与用户输入有效整合的过程，这是RAG系统中至关重要的环节。通过多维度指标的综合分析，可针对性优化RAG系统的薄弱环节，实现高效可靠的知识增强生成。 6. 应用场景与挑战典型场景：开放域问答、文档摘要、客服自动化、代码生成。理解这些概念有助于设计高效、可靠的RAG系统，尤其在减少生成错误与提升信息可信度方面具有显著优势。 8.
54710编辑于 2025-03-26
来自专栏Reinvent Data Science
RAG 修炼手册｜如何评估 RAG 应用？
当以黑盒方式来评估 RAG 应用时，我们看不到 RAG 应用的内部，只能从输入给 RAG 应用的信息和它返回的信息来评估 RAG 的效果。对于一般的 RAG 系统，我们只能访问这三个信息：用户提问（User's query）、RAG 系统召回的引用上下文（retrieved contexts）、RAG 系统的回答（RAG's response 我们使用这三个信息来评估 RAG 应用的效果，黑盒方式是一种端到端的评估方式，也比较适用于评估闭源的 RAG 应用。当以白盒方式来评估 RAG 应用时，我们能看到 RAG 应用的内部所有流程。白盒方式可以用来评估开源 RAG 应用，或者提升自研 RAG 应用。 02. ）、RAG 系统的回答（RAG's response）。
1.1K11编辑于 2024-04-25
来自专栏coder
什么是 RAG，为什么要用 RAG？
为什么要用 RAG ？ RAG 引用信息来源是用户可以核实答案，因此其透明透非常高，这增强了人们对模型输出结果的信任。透过获取与特定领域数据，RAG能够为不同领域提供专业的知识支持，定制能力非常高。由于 RAG 不需更新模型参数，因此在处理大规模数据集时，经济效率方面更具优势。不过虽然RAG有许多优势在，但这3种方法并不是互斥的，反而是相辅相成的。什么是 RAG ？这篇章旨在介绍 RAG 的过程与其使用的相关技术。 RAG 生态系 RAG 的生态系蓬勃发展，在水平领域，从最初的文本问答领域以外，RAG 的应用逐渐拓展到更多模态数据，包括图像、代码、结构化知识、影音等。在这些领域，已经涌现许多相关研究成果。
45510编辑于 2024-09-06
来自专栏AgenticAI
Agentic RAG：超越传统RAG与案例分享
RAG 框架不断推陈出新、日新月异，从 Navie RAG、高级 RAG、模块化 RAG，发展到现在的 Graph based RAG，甚至混合高级 RAG 与 GraphRAG 的 HybridRAG 本文先讨论 Agentic RAG 常见范式，然后推荐一些流行的 Agentic RAG 开发示例：Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG Nvidia Agentic RAG Nvidia 展示的 Agentic RAG 只是一个示例，参考了如下 3 篇论文实现。路由 (Adaptive-RAG[1]). agentic-rag-llama 比如你可能会问：“比较一下 adapt rag 和 self-rag，首先分析各个论文中的方法”，查询重写模块可能会将用户提问分解为： adapt rag 中的方法 self rag 中的方法对比 self rag 和 adapt rag 然后 Router 会分别调用 self rag 的 summary tool 和 adapt rag 的 summary tool
1.6K10编辑于 2025-03-18
来自专栏自然语言处理
Agentic RAG 解释
RAG（检索增强生成）通过提供来自外部知识源的相关背景来帮助提高 LLM 答案的准确性和可靠性。 Agentic RAG 是高级 RAG 版本，它使用 AI 代理来更加自主地行动。 Agentic RAG 执行以下操作查询理解、分解和重写检索策略选择知识库管理结果综合与后处理迭代查询和反馈循环
21400编辑于 2025-01-09
来自专栏码农编程进阶笔记
RAG原理总结
所以RAG要做的事情就是将知识库分割，然后利用向量模型做向量化，存入向量数据库，然后查询的时候去检索：第一阶段（存储知识库）：将知识库内容切片，分为一个个片段将每个片段利用向量模型向量化将所有向量化后的片段写入向量数据库
21810编辑于 2025-08-14
来自专栏机器学习与统计学
RAG 已死？
本讨论了关于“RAG 已死”的争议性观点。本解释说，这一说法仅适用于一种非常狭窄且经常被误解的 RAG 定义，这种定义是由营销活动普及开来的。这是理解 RAG 如何改变流程的基础。使用 RAG 时，会插入一个新的步骤：“上下文文档”。本强调，获取这些文档的“方法”并不影响定义。如果你在上下文窗口中添加了外部文档以增强生成内容，你就是在进行 RAG。即使手动复制粘贴文本到提示中，从技术上讲，这也是一种形式的 RAG。本总结到目前为止的要点： RAG 并不会消失。简单的方法（如基本的余弦相似度）已经显示出其局限性，推动我们向更好的、更复杂的检索技术发展。 RAG 是向模型提供最新信息的最佳方式。同样地，“2023 年的 RAG”被杀死的原因仅仅是更好的 RAG（具体来说，是更好的检索形式）。
7600编辑于 2025-07-12
来自专栏图像处理与模式识别研究所
Rag图像分割
label_rgb1,labels,(0,0,0))#标记边界 intdata1=label_rgb1.astype(np.uint8) cv2.imshow("result1",intdata1) g=graph.rag_mean_color (img,labels)#计算每个小图块权重 labels2=graph.merge_hierarchical(labels,g,thresh=35,rag_copy=False,in_place_merge merge_mean_color,weight_func=_weight_mean_color)#合并权重相近图块 label_rgb2=color.label2rgb(labels2,img,kind='avg')#rag Adjacency Graph number of segments: 1183 Region Adjacency Graph number of segments: 157 算法：区域邻接图（RAG
1.1K10编辑于 2022-05-28
来自专栏云原生技术社区
RAG是什么？
检索增强生成（RAG）是对大型语言模型输出进行优化的方法，使其能够在生成响应之前引用训练数据来源之外的权威知识库。 RAG 允许开发人员为生成模型提供最新的研究、统计数据或新闻。他们可以使用 RAG 将 LLM 直接连接到实时社交媒体提要、新闻网站或其他经常更新的信息来源。然后，LLM 可以向用户提供最新信息。在没有 RAG 的情况下，LLM 将接受用户输入并基于其接受的训练信息或已知信息生成响应。引入了 RAG 后，系统加入了一个信息检索组件，该组件通过用户输入首先从新数据源提取信息。图示：RAG 与 LLM 配合使用的概念流程检索增强生成和语义搜索有什么区别？语义搜索可以提高 RAG 结果，适用于想要在其 LLM 应用程序中添加大量外部知识源的组织。它们还生成语义相关的段落和按相关性排序的标记词，以最大限度地提高 RAG 有效载荷的质量。
1.3K10编辑于 2024-02-22
来自专栏大模型技术应用
RAG 技术综述
RAG整体框架基础RAG 基础 RAG 案例的过程大致如下：首先，将文本分割成不同的段落；接着，使用某种 Transformer 编码器模型将这些段落转换成向量；然后，把这些向量存储到一个索引中；最后高级RAG 初级 RAG 在信息检索、内容生成和信息增强方面存在挑战。为此，高级 RAG 应运而生，它在检索前后加入了额外的处理步骤。注：绿色元素代表我们将要深入讨论的核心 RAG 技术，蓝色元素则表示文本模块化 RAG 模块化 RAG结构不仅更加灵活自由，还引入了更多定制化的功能模块，例如查询搜索引擎和多答案整合。从流程上看，RAG 的各个模块被精心设计和调配，形成了多种RAG模式。但模块化 RAG 并非一蹴而就；它是在前两个范式基础上逐步演化而来的。高级 RAG 可以看作是模块化 RAG 的一个特殊实例，而初级 RAG 则是高级 RAG 的一个简化版本。
1.8K11编辑于 2024-02-01
来自专栏charlieroro
LLM RAG系列
RAG系列本文介绍了RAG以及RAG pipeline的整个流程，包括请求转换、路由和请求构造、索引和检索、生成和评估等，其中引用了大量有价值的论文。 Chat History: {chat_history} Follow Up Input: {question} Standalone Question:" RAG Fusion: 将RAG和倒数排名融合 RAG和ICL的模型可以将准确性提高20%以上。下表中可以看到，CRAG显著优于RAG。self-CRAG则使这些差距更加明显，并且展示了CRAG作为RAG流水线"即插即用"的适应性。通过将Langsmith和RAG进行结合可以帮助我们更深入地了解结果。
97325编辑于 2024-04-02
【大模型 RAG】
RAG模型是一种用于文本摘要任务的生成模型，它能够根据输入的文本生成摘要。 , RagTokenForGeneration # 加载RAG模型及其分词器 model_name = "facebook/rag-token-nq" tokenizer = RagTokenizer.from_pretrained 首先，我们通过RagTokenizer.from_pretrained()方法加载RAG模型的分词器。而在工业界，企业通常会将大模型 RAG 技术应用到实际的产品和应用中，解决一些实际问题。总之，大模型 RAG 场景下的产学结合是学术界和工业界合作研究和应用大模型 RAG 技术的一种方式，通过合作与交流，推动该领域的发展和应用。
10210编辑于 2025-08-29
来自专栏深度学习与python
解码RAG：智谱 RAG 技术的探索与实践
另外，即将于 8 月 18-19 日举办的 AICon 上海站同样设置了【RAG 落地应用与探索】专题，我们将深入探讨 RAG 的最新进展、成果和实践案例，详细分析面向 RAG 的信息检索创新方法，包括知识抽取为此，智谱 AI 组建了一支专业团队，专注于打造企业服务场景的 RAG 系统，致力于为客户提供全面的支持与服务。那么使用 RAG，有哪些优势呢？我们总结有以下几个方面：与直接跟大模型对话的方法相比，RAG 可以更好地解决模型的幻觉、知识更新不及时等问题。与传统的 FAQ 或者搜索的方式相比，RAG 可以显著降低实施成本。所以在同样精度的情况下，利用 RAG 技术可以大大地降低整个成本。智谱 -RAG 解决方案技术方案下图是技术方案的全景图整个技术方案包括三个层面：文件上传、用户提问和答案输出。智谱 - RAG 在智能客服的实践下面我以「公共事务客服问答场景」为例，介绍我们在 RAG 上的实践。这个场景其实大家都比较熟悉。例如 12329 公积金便民热线。
92722编辑于 2024-06-27
来自专栏架构进阶
大模型RAG：文档分块方案与RAG全流程
一 RAG与文本分块1.1 为什么要文档分块在上一篇文章《大模型RAG：基于PgSql的向量检索》中，简单介绍了RAG概念和简要实现。在实际的应用中，技术方案远不会这样简单。我们知道，大模型在预训练阶段获取的知识是有限的，一般需要数据增强模块引入外部知识库，通过知识检索的方式搜索于用户提问相关的知识，这也是RAG相关应用架构出现的原因。（注：目前很多大模型已经支持192K甚至更大的超长上下文窗口+搜索增强知识库，但基于成本和性能考虑，大文档分chunk依然是RAG方案必须包含的环节）。四从文档角度出发的RAG技术方案从文档角度出发，RAG流程中的各个主要环节如下：关键概念说明：RAPTOR：RAPTOR模型提出了一种创新的策略。 GraphRAG仍然沿袭了RAG的思路，即通过检索来增强模型的准确性。
1.1K12编辑于 2025-02-28

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

RAG 作者：RAG 已死，RAG 万岁！

【RAG】001-RAG概述

rag

RAG Logger：RAG日志记录工具

独家 | 进阶RAG-提升RAG效果

RAG 2.0，让RAG 终成正果

【RAG】001.1-RAG相关核心概念

RAG 修炼手册｜如何评估 RAG 应用？

什么是 RAG，为什么要用 RAG？

Agentic RAG：超越传统RAG与案例分享

Agentic RAG 解释

RAG原理总结

RAG 已死？

Rag图像分割

RAG是什么？

RAG 技术综述

LLM RAG系列

【大模型 RAG】

解码RAG：智谱 RAG 技术的探索与实践

大模型RAG：文档分块方案与RAG全流程

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐