论文链接:https://arxiv.org/abs/2501.09136 Github仓库:https://github.com/asinghcsu/AgenticRAG-Survey
代理式检索增强生成(Agentic RAG)通过在RAG管道中嵌入自主代理,代表了人工智能领域的重大飞跃。本仓库补充了综述论文《代理式检索增强生成(Agentic RAG):综述》,提供了以下方面的见解:
检索增强生成(RAG)系统结合了大型语言模型(LLMs)和检索机制,生成上下文相关且准确的响应。虽然传统RAG系统在知识检索和生成方面表现出色,但在处理动态、多步推理任务、适应性和复杂工作流的编排方面往往存在不足。
代理式检索增强生成(Agentic RAG)通过集成自主AI代理克服了这些限制。这些代理采用核心的代理模式,如反思、规划、工具使用和多代理协作,动态适应任务特定需求,并在以下方面提供卓越性能:
本文探讨了从RAG到Agentic RAG的演进,展示了:
无论您是研究人员、开发者还是实践者,本仓库都提供了宝贵的见解和资源,帮助您理解和推进Agentic RAG系统。
Agentic RAG系统的智能和适应性来源于定义明确的代理模式。这些模式使代理能够处理复杂的推理任务,适应动态环境,并有效协作。以下是Agentic RAG的核心模式:
这些模式构成了Agentic RAG系统的核心,使其能够:
代理式检索增强生成(RAG)系统涵盖了多种架构和工作流,每种架构都针对特定任务和复杂性级别进行了优化。以下是这些系统的详细分类:
图基RAG系统通过集成图数据结构进行高级推理,扩展了传统RAG。
代理式文档工作流(ADW)通过智能代理自动化以文档为中心的流程,扩展了传统RAG系统。
下表提供了三种架构框架的全面比较分析:传统RAG、Agentic RAG和代理式文档工作流(ADW)。该分析突出了它们各自的优势、劣势和最佳适用场景,为跨多样化用例的适用性提供了宝贵见解。
特性 | 传统RAG | Agentic RAG | 代理式文档工作流(ADW) |
---|---|---|---|
重点 | 孤立的检索和生成任务 | 多代理协作和推理 | 以文档为中心的端到端工作流 |
上下文维护 | 有限 | 通过记忆模块实现 | 在多步工作流中维护状态 |
动态适应性 | 最小 | 高 | 针对文档工作流定制 |
工作流编排 | 无 | 编排多代理任务 | 集成多步文档处理 |
外部工具/API的使用 | 基本集成(如检索工具) | 通过API和知识库扩展 | 深度集成业务规则和领域特定工具 |
扩展性 | 限于小数据集或查询 | 适用于多代理系统 | 适用于多领域企业工作流 |
复杂推理 | 基础(如简单问答) | 多步推理与代理 | 跨文档的结构化推理 |
主要应用 | 问答系统、知识检索 | 多领域知识和推理 | 合同审查、发票处理、索赔分析 |
优势 | 简单性、快速设置 | 高准确性、协作推理 | 端到端自动化、领域特定智能 |
挑战 | 上下文理解不足 | 协调复杂性 | 资源开销、领域标准化 |
代理式检索增强生成(RAG)系统在多个行业中具有变革性潜力,能够实现智能检索、多步推理和动态适应复杂任务。以下是Agentic RAG系统产生重大影响的关键领域:
尽管代理增强检索生成(Agentic RAG)系统展现出巨大的潜力,但仍存在一些未解决的挑战和研究机会:
技术 | 工具 | 描述 | 笔记本 |
---|---|---|---|
单代理RAG | LangChain, FAISS, Athina AI | 使用AI代理通过向量数据库和网络搜索找到并生成答案。 | 查看笔记本 |
LlamaIndex, Vertex AI (向量存储, 文本嵌入, LLM), Google Cloud Storage | 展示使用LlamaIndex和Vertex AI的单路由器Agentic RAG系统,用于上下文检索和响应生成。 | 查看笔记本 | |
LangChain, IBM Granite-3-8B-Instruct, Watsonx.ai, Chroma DB, WebBaseLoader | 使用IBM Granite-3-8B-Instruct模型在Watsonx.ai中构建Agentic RAG系统,以回答复杂查询并提供外部信息。 | 查看笔记本 | |
LangGraph, Chroma, NVIDIA推理微服务 (NIMs), Tavily搜索API | 该系统使用基于路由器的架构,决定查询应由RAG管道(从向量数据库检索)还是网络搜索管道处理。AI代理评估查询主题并将其路由到适当的管道以进行信息检索和响应生成,确保准确、相关和上下文增强的答案。 | 查看笔记本 | |
LlamaIndex, Redis, Amazon Bedrock, RedisVectorStore, LlamaParse, BedrockEmbedding, 语义缓存 | 该系统实现了基于ReAct代理的RAG管道,代理与Redis支持的索引和向量存储交互,以从PDF文档中检索和处理数据。它使用Amazon Bedrock嵌入和LlamaIndex处理文档、构建嵌入并处理基于检索的增强生成。此外,语义缓存通过减少对重复或相似用户问题的冗余LLM查询来优化系统,提高响应时间和效率。 | 查看笔记本 | |
多代理RAG协调器 | AutoGen, SQL, AI搜索索引 | 该协调器利用多代理系统通过协调代理交互促进复杂任务执行。使用工厂模式和各种预定义策略(例如,用于检索增强生成的classic_rag和用于将自然语言翻译为SQL的nl2sql),系统支持灵活的多代理协作,用于数据库查询和文档检索等任务。协调器支持代理通信、迭代响应和可定制策略,为多样化用例提供高度适应性。 | 查看笔记本 |
分层多代理RAG | Weaviate, ExaSearch, Groq, crewAI | 该方法使用分层代理架构,多个代理各自负责特定任务或工具。管理器代理协调专门代理(如用于内部文档检索的WeaviateTool、用于网络搜索的ExaSearchTool和用于快速AI推理的Groq)以处理复杂查询。该灵活的任务导向系统支持各种用例,如QA和工作流自动化。 | 查看笔记本 |
纠正RAG | LangChain, LangGraph, Chromadb, Athina AI | 精炼相关文档,删除不相关文档或进行网络搜索。 | 查看笔记本 |
LangChain, FAISS, HuggingFace推理API, SmolAgents, HyDE, 自查询 | 该系统结合查询重构和自查询策略,解决传统RAG系统的局限性。它通过批判检索文档的相关性并在需要时重新查询来执行迭代检索。代理精炼查询以提高语义相似性并确保更高的准确性。自评分机制评估检索信息的质量,通过迭代改进增强结果。该系统通过减少虚构内容并提高检索相关性,符合纠正RAG原则。 | 查看笔记本 | |
自适应RAG | LangChain, LangGraph, FAISS, Athina AI | 根据查询类型调整检索方法,使用索引数据或网络搜索。 | 查看笔记本 |
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有