Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >LLM就是框架,Agent就是应用,Workflow就是架构

LLM就是框架,Agent就是应用,Workflow就是架构

作者头像
否子戈
发布于 2024-04-12 08:59:58
发布于 2024-04-12 08:59:58
7000
举报
文章被收录于专栏:

很多人都在思考,LLM-based时代的应用应该怎么去开发。然而,时代的惯性会束缚我们的思维,就像iphone颠覆式出现一样,在它成为市场主流之前,我们根本想不出在手机屏幕上的软件会如此不同。这让我想到那句著名的论断,汽车出现之前,人们对交通工具的究极想象都是围绕马展开,给马带上昂贵的装备,给马车装上牛逼的助推器,而当汽车出现时,人们才恍然大悟,原来交通工具可以不需要马。AI时代的到来,新的iphone时刻,是否会改变人们使用信息技术的方式?人机的交互方式,还会永远和当下一样吗?计算机上的各种功能,将会以怎样的方式在我们的工作和生活中提供能力?本文将详细聊一聊这个话题。

LLM是基础设施

前段时间,英伟达发布了自己的本地大模型服务,购买它的显卡,可以直接在硬件上运行一个LLM。马斯克开源了迄今为止开源界参数最大的Grok,有人将它的源代码整理成一个可视化的3D模型,用以演示Grok的神经网络,人们发现Grok的架构如此复杂,层数如此之多,以完全超出现代工程的人力承受范围。大语言模型已经成为一种价格昂贵但唾手可得的基础设施。

去年大家都在讨论LLM的能力涌现,例如推理能力,当然,也无法避开它的幻觉。然而,今年,世界似乎已经发生了翻天覆地的变化。市场上的大模型应用越来越多,但目前来看,很多都是类Chat类应用,要说出现井喷式爆发,还为时尚早。

当然,现在仍然有非常多的人对LLM的理解还停留在ChatGPT的形式上,他们把大模型等同于和ChatGPT形式一模一样的聊天机器人。只有较少的人会把LLM理解为更底层的工具,它用以支撑和驱动新能力的开发,这类工具我们常常称为框架。简单讲,框架就是一系列工具的集合,以提升开发效率,让开发形成一种范式。而在AI领域做应用开发,在LLM之前有各种模式,现在LLM已经一统江湖,任何的AI应用,都可以用LLM来开发,这让我们的智能化应用(或者说需要智能化的功能)开发变得极为简单了。

举个例子,前几天,我在公众号 wwwtangshuangnet 中讲了自己利用AI来设计自己的DSL,里面除了借助chat来获得灵感外,另一个重要的点,就是直接利用LLM将自然语言生成DSL。

这在以前几乎是不可能的,也就意味着如果用户没有掌握平台定制的DSL,就无法使用某些功能,而在LLM成为基础设施之后,我们的开发更加贴近用户,更容易把用户的想法放到产品中去执行。而在这个过程中,我们甚至可以减少编程中间过程,因为现在很多大模型都有了直接执行代码的能力(functional calling)。这也代表着,必须一个字一个字准确编程的时代过去了,新的基于LLM的编程,可以在模糊的表达下完成编程过程,因此,也有人说,“面向对象”将会消失,“面向目标”将会爆发,以描述目标(而非机器执行)为编程内容的范式会逐渐兴起,这和SQL的设计极为相似,恰巧的是,有一个叫Chat2DB的项目,可以实现智能的数据查询和报表能力,直接用自然语言替代了SQL。

此外,LLM自身的封装性良好,这也就意味着,我们切换底层框架的灵活性大大提升。当我们发现更好更智能的LLM的时候,我们可以用非常小的代价切换底层设施到新的依赖上,这也使得我们的架构设计更加灵活,安全性更强,可持续迭代的能力更可靠。

Agent是AI时代的主角

之前的文章中,我有讲过,Agent作为AI时代功能搭建的基本单位,会出现真正的百花齐放。在移动互联网时代,APP是我们享受信息网络的入口,而到了AI时代,Agent就会替代APP,成为新时代的信息网络入口。

AI时代的核心使命,是极速的提升人们获取信息的效率和质量。人类获取信息的模式经历了很多次变革,从口口相传到结绳记事,从档案文书到信息管理,今天,我们将面临着走向知识管理的终极——智慧发掘。LLM-based AI把这种信息获取的难度拉的极低,以前我们要了解一个知识,需要从一部百科全书图书中去查找,效率和质量都很低,而在LLM的加持下,我们可能只需要10秒钟就可以获得高质量的知识内容。接下来的时代,我们需要把这一智能利用往前推一部,让人类突破信息传递的次元壁,能够让人类借助AI的力量,在有限的人类脑力前提下,获得最大程度的智力加持

过去,我们有一个说法,手机是人类身体长出来的第三器官。因为人类已经无法离开手机了,所以它就像器官一样被我们需要和使用。而我相信,AI会成为人类的第二大脑,同时,人类还会长出第四器官。作为第三器官,手机智能在虚拟层面帮助人们解决一些效率问题,作为第四器官,Agent将会借助各种硬件,直接在现实中增强人类的生理极限。过去,让人长出第三只手,或者让人长出一对翅膀,人类的大脑是无法承受的,过去通过脑电波的形式来实现人体外肢的实践,即使再过几十年也不会有大的进展。而在大模型加持下,自适应的外肢并不需要大脑的直接控制,而是可以由大模型为大脑的AI系统控制,与人体的其他系统协调工作,就像人的淋巴系统、内分泌系统一样,与大脑协同工作。

AI系统是由Agent作为最小单元分工协作构成的,我们需要井喷式的Agents来为我们的创意提供原材料,就像开放世界游戏一样,只有当能满足我们创意的原材料都具备的时候,我们才能快速实现它,而当下,Agent还是太匮乏。

我认为很多人把Agent的设计看的太过复杂,我认为Agent就是非常简单的输入输出模式,对于我们现有的很多功能,都是可以重新设计为Agent的,甚至有时候不一定需要LLM,只要它能按照某种Agent协议,实现输入输出接口,就可以被用到AI系统中,作为组成宏大目标的一部分。

这个图是我提出来的一种设计模式,感知Agent和行动Agent本身通过事件协议与中枢部分沟通,通过端口与外界的硬件、软件联系。一旦这种通用的协议形成共识,我们的Agent市场将会很快丰富起来。有了足够多的Agent,我们接下来要办的事,就是让这些Agent能够协同工作。

Agent Workflow会是终极吗?

工作流是串联一系列单元,使它们能够按照开发者目标完成动作的有效方式。这些工作单元,如果独立去看,可能与我们最终的目标相去甚远,但是我们通过工作流,把这些看上去相去甚远的单元组织在一起,有效的分配任务,就可以实现我们自己的目标。世界上很多事情都是这样,看上去相去甚远的部件,可能在系统中起着关键作用,就像制作钓鱼竿的碳纤维材料成为我国航天公关中的关键突破,就像我们平时写的代码分看来每个语法都平平无奇,组合在一起却功能强大。

对应到我们的编程中,Workflow就是架构,即用以实现我具体目标的整体AI工作系统,与构成该系统的Agent工作单元之间的交互、联系、调度等等。

前几天,我看到一则消息,国外某实验室正在尝试让AI训练AI。当我们允许AI在解决我们提出的具体需求时,且它自己认为自己无法满足该需求的情况,可以通过训练一个具有针对性的AI来解决该问题时,AI就实现了自举。当这一现象产生时,意味着真正的AGI时刻到来了。那么这里有个问题,AI训练AI是我们的设定,还是AI自己的决策呢?如果在我们的设计中,没有这种设计,AI是否有能力自己想到要去训练一个AI来解决具体问题?

所以,当我们去设计Agent工作流时,我们应该换一个角度,即每一个Agent都是一个举足轻重的角色,就像工作中的同事,如果屏蔽了具体形象,只要它能完成工作流中的环节任务,那么无论他有没有实体生命,都需要在工作中被平等看待。

上图是一种拟人化的Agent工作流设计,这种设计把Agent作为工作环节上的角色,完成特定工作内容。虽然这些角色可以由人来代替,但是我们现在是在讨论AI系统,我们作为用户,期望得到的是结果。

从上面的设计来看,AI系统本身并不具备自举的潜力,因为我们往往只会根据当下的业务需要来设计工作流。即使我们在工作流环节中,允许AI进行AI训练,也会是把AI训练交给具体的Agent来完成,而Agent本身并不是主动决策自己要进行AI训练,它更多的是承担“人力”而非“人才”的角色。至于整套系统来说,就更不存在自己训练AI的说法。(当然,我们并不排除有人就是要设计一个可以训练AI的AI系统,而且据我所知,现在头部的大厂们,确实就是在用AI来训练大模型。)

结语

本文从思考AI时代的人机交互形式出发,提出了AI时代的Agent等效于移动互联网时代的APP的观点。手机上的APP是软件,而Agent则不局限于软件,还可以是硬件等。过去我们比较关注代码实现,“面向对象”是最流行的编程范式。但在以LLM为基础设施的时代,我们可以大幅减少对代码实现的依赖,比如一些算法、提取、转化、分析等,一起我们可能需要写大段代码,甚至搭建一套系统来实现,而现在,基于LLM的能力,可以直接获得结果。目前来说,其实我们的LLM基础设施已经很强了,比较欠缺的是Agent,现在的Agent实在是太少了,想要构建AI系统,任何功能(Agent)都需要自己从0去造。当然,或许这也是机会。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 唐霜 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
LLM Agent 简介
GPT(尤其是GPT-4)等大语言模型(LLM)的推出,让人类认识到了大语言模型强大的文本生成能力。 只是用来做文本生成工具的话,LLM的能力就被严重低估了。Agents的想法的出现,则进一步激发了开发者的想象力。 AI Agents被认为是OpenAI的下一个发力方向,也是通用人工智能(AGI)时代的开始。
windealli
2024/01/12
5.8K0
LLM Agent 简介
超干货!如何设计基于Agent的AI应用系统
由复旦NLP和米哈游调查完成的文献综述《The Rise and Potential of Large Language Model Based Agents: A Survey》详细阐述了LLM-based Agent的相关理论、实践模型和深度思考,知乎上有大神做了详细的解读,我下面基于此再做白话版总结。
否子戈
2024/03/26
2K0
超干货!如何设计基于Agent的AI应用系统
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一下,你有一个虚拟助手,可以回答各种关于公司内部知识的问题,无论是政策、流程,还是技术文档,MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等
汀丶人工智能
2024/08/05
12K0
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
一文搞懂大模型!基础知识、 LLM 应用、 RAG 、 Agent 与未来发展
LLM 探秘:想要深入了解人工智能界的“新宠”大型语言模型(LLM)吗?本文将带你走进 LLM 的世界,从入门知识到实际应用,全方位解读这个充满魔力的“大模型”。我们将一起揭开 LLM 的神秘面纱,领略其在各个领域的独特魅力。无论你是初学者还是有一定基础的 AI 爱好者,这篇文章都将为你提供宝贵的知识和启发,让你的 AI 之旅更加精彩纷呈!快来加入我们,一起探索 LLM 的奥秘吧!
腾讯云开发者
2024/07/19
5.8K0
一文搞懂大模型!基础知识、 LLM 应用、 RAG 、 Agent 与未来发展
深入浅出智能工作流(Agentic Workflow)|技术干货
著名 AI 学者、斯坦福大学教授吴恩达提出了 AI Agent 的四种设计方式后,Agentic Workflow(智能体工作流)立即火爆全球,多个行业都在实践智能体工作流的应用,并推动了新的 Agentic AI 探索热潮。
Botnow
2024/09/18
1.2K0
深入浅出智能工作流(Agentic Workflow)|技术干货
AI Agent,为什么是AIGC最后的杀手锏?
AI Agent无疑是当下大模型最激动人心的发展主线,被称为“大模型下一场战事”“最后的杀手产品”“开启新工业革命时代的Agent-centric”。11月7日,OpenAI首届开发者大会(OpenAI DevDay)引爆了AI Agent。OpenAI发布了AI Agent初期形态产品GPTs,并推出了相应的制作工具GPT Builder。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。专属GPT可以在日常生活、特定任务、工作或家庭中更为适用。为此,OpenAI还开放了大量的新API(包括视觉、图像DALL·E3、语音),以及新推出的Assistants API,让开发者可以更便捷地开发自己专属的GPT。比尔·盖茨最新发表一篇文章明确提出,5年内AI Agent将大行其道,每个用户都将拥有一个专属AI Agent。用户不需要再因为不同的功能需求而使用不同的APP,他只需用日常语言告诉他的Agent想做什么就可以。[1]
小腾资讯君
2023/11/29
2.4K0
AI Agent,为什么是AIGC最后的杀手锏?
AI Agent框架(LLM Agent):LLM驱动的智能体如何引领行业变革,应用探索与未来展望
有很多人或许会疑惑,Agent 这个东西看起来跟 LLM 也没差得那么远,那为啥最近突然 Agent 那么火,而不称之为 LLM-Application 或者其他的词呢?这就得从 Agent 的来历上说起了,因为 Agent 是个很古老的术语,甚至可以追溯至亚里士多德和休谟等人的言论。从哲学意义上讲,“代理人”是指具有行动能力的实体,而 “代理” 一词则表示这种能力的行使或体现。而从狭义上讲,“代理”通常是指有意行动的表现; 相应地,“代理人” 一词表示拥有欲望、信念、意图和行动能力的实体。需要注意的是,代理人不仅包括人类个体,还包括物理世界和虚拟世界中的其他实体。重要的是,“代理” 的概念涉及个人的自主性,赋予他们行使意志、做出选择和采取行动的能力,而不是被动地对外部刺激做出反应。
汀丶人工智能
2024/07/05
3K0
AI Agent框架(LLM Agent):LLM驱动的智能体如何引领行业变革,应用探索与未来展望
复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来
近期,复旦大学自然语言处理团队(FudanNLP)推出 LLM-based Agents 综述论文,全文长达 86 页,共有 600 余篇参考文献!作者们从 AI Agent 的历史出发,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-based Agent 的背景、构成、应用场景、以及备受关注的代理社会。同时,作者们探讨了 Agent 相关的前瞻开放问题,对于相关领域的未来发展趋势具有重要价值。
机器之心
2023/09/19
12K0
复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来
【愚公系列】《AI Agent技术、应用与商业》006-Al Agent的架构和组成
在人工智能的快速发展中,智能代理(AI Agent)成为了推动各行各业智能化转型的重要力量。无论是在智能客服、智能推荐,还是在自动化决策系统中,智能代理都扮演着至关重要的角色。然而,很多人对智能代理的内部架构和组成部分仍然感到陌生。它们是如何工作的?又由哪些关键组件构成?
愚公搬代码
2025/03/15
3340
AI Agent,为什么是AIGC最后的杀手锏?
AI Agent无疑是当下大模型最激动人心的发展主线,被称为“大模型下一场战事”“最后的杀手产品”“开启新工业革命时代的Agent-centric”。11月7日,OpenAI首届开发者大会(OpenAI DevDay)引爆了AI Agent。OpenAI发布了AI Agent初期形态产品GPTs,并推出了相应的制作工具GPT Builder。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。专属GPT可以在日常生活、特定任务、工作或家庭中更为适用。为此,OpenAI还开放了大量的新API(包括视觉、图像DALL·E3、语音),以及新推出的Assistants API,让开发者可以更便捷地开发自己专属的GPT。比尔·盖茨最新发表一篇文章明确提出,5年内AI Agent将大行其道,每个用户都将拥有一个专属AI Agent。用户不需要再因为不同的功能需求而使用不同的APP,他只需用日常语言告诉他的Agent想做什么就可以。[1]
腾讯研究院
2023/12/07
1.8K0
AI Agent,为什么是AIGC最后的杀手锏?
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用,成为网络任务智能体新SOTA
网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算,它可以帮你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。
机器之心
2025/02/14
810
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用,成为网络任务智能体新SOTA
基于大模型(LLM)的Agent 应用开发
目前,业界一般认为基于大模型的应用集中在两个方向上:RAG 和 Agent,无论哪一种应用,设计、实现和优化能够充分利用大模型(LLM)潜力的应用都需要大量的努力和专业知识。随着开发人员开始创建日益复杂的LLM应用程序,开发流程不可避免地变得更加复杂。这种流程的潜在设计空间可能是巨大而复杂的,《如何构建基于大模型的App》一文给出了一种探索中的大模型应用开发基础框架,基本可以适用于RAG 和Agent。但是,对于面向Agent的大模型应用开发,有没有其独特之处呢?有没有聚焦于Agent的大模型应用开发框架呢?
半吊子全栈工匠
2023/10/23
6.4K0
基于大模型(LLM)的Agent 应用开发
LLM Agent提效揭秘4:多智能体协作工作流深度剖析
在此之前,我们已经从论文到代码深度解读了大语言模型4种Agent 工作流的三种:反思、工具使用和规划。今天我们将深入最后一种Agent工作流:多智能体协作工作流。
AgenticAI
2025/03/18
3180
LLM Agent提效揭秘4:多智能体协作工作流深度剖析
探索前沿AI技术:什么是LLM框架?什么是Agent应用?什么是Workflow架构?
在本篇博文中,我们将深入探讨三个重要的技术概念:LLM框架(Large Language Models)、Agent应用和Workflow架构。这些技术正在重塑我们理解和实施人工智能的方式,对于开发者、技术架构师以及科技爱好者都是不可或缺的知识。文章通过详细的技术分析、实际代码案例和操作命令介绍,旨在提供一个全面的理解和实用的指南。关键词包括:人工智能、LLM框架、Agent技术、Workflow操作、技术创新、AI应用等。
猫头虎
2024/05/24
2.2K0
探索前沿AI技术:什么是LLM框架?什么是Agent应用?什么是Workflow架构?
Coze背后的人,你什么时候顿悟的Agent?
过去一段时间,我深度体验了coze平台,随着它新版本的发布,我意识到自己以前对Agent的理解在细节上的偏差,而coze背后的产品团队,让我理解了真正的Agent,应该长什么样子。
否子戈
2024/06/12
8840
Coze背后的人,你什么时候顿悟的Agent?
AI视听应用逐渐成为Agent发展趋势和机会
近期,多家厂商发布了视觉模型,结合C端应用市场的情况,我有理由相信,AI应用方向正在从LLM聊天应用向视觉应用转变。从单纯的聊天工具大行其道,到类似写作类copilot工具的盛行,AI应用在2024年已经呈现出了巨大的潜力,但你要知道,现在才5月,从业界顶尖会议提出AI应用将成大趋势,到现在才不过短短半年,可见在AI应用领域,世界发展的有多快。本文就来聊一聊我所看到的趋势和机会。
否子戈
2024/05/13
1890
AI视听应用逐渐成为Agent发展趋势和机会
[算法前沿]--061-生成式 AI 的发展方向,是 Chat 还是 Agent?
AI Agent是一种超越简单文本生成的人工智能系统。它使用大型语言模型(LLM)作为其核心计算引擎,使其能够进行对话、执行任务、推理并展现一定程度的自主性。简而言之,Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。
AI拉呱
2024/02/09
7560
[算法前沿]--061-生成式 AI 的发展方向,是 Chat 还是 Agent?
AI Agent深度调研:设计一个QQ机器人
随着大模型的兴起,AI Agent被认为是大模型最重要的落地方向之一,无论是在学术界还是在工业界,对AI Agent的各种研究和实践一直热度很高。本文主要从 AI Agent的研究背景、学术界对AI Agent的探索、工业界对AI Agent的探索、基于AI Agent的QQ机器人设计构思这几个角度展开,聊聊AI Agent的一些调研结果。我们先来看下AI Agent的发展历史。
腾讯技术工程官方号
2024/08/08
6840
AI Agent深度调研:设计一个QQ机器人
基于Workflow的Agent应用设计与实战
2023年市面上出现了很多和大模型相关的产品,旧金山的Prompt AI融资了500万美元,来自新加坡的Neuronicx成为全球最知名的GPT账号服务商,国内的各类套壳网站通过广告和会员赚的盆满钵满。之后,文心一言、通义千问、智普清言等服务商迅速降低了国内的大语言模型使用门槛,字节发布了第一个面向普通用户的手机App豆包则把大模型的使用门槛进一步拉低。2024年,初创公司Cognition Labs发布了全球首款全智能AI程序员Devin,字节发布coze,大模型开发进入了新的事态,让普通非编程用户基于大模型做符合自己需求的应用成为可能。
否子戈
2024/04/26
2.1K1
基于Workflow的Agent应用设计与实战
当我们在谈论LLM Agent的时候,我们在说什么?
想象一下,如果机器不仅能理解你的言语,还能像人类一样思考、感知并采取行动,这不就是电影照进现实,未来已来吗?诸如AutoGPT、BabyGPT、ChatDev、MetaGPT和AutoGen之类的创新应用,正生动展现了这一前沿领域的无限潜力。基于大语言模型(LLMs)Agent(后文也称代理),正以前所未有的方式重塑人工智能的边界。
AgenticAI
2025/03/18
850
当我们在谈论LLM Agent的时候,我们在说什么?
推荐阅读
相关推荐
LLM Agent 简介
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档