前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >吴恩达:四种AI Agent设计模式

吴恩达:四种AI Agent设计模式

作者头像
石云升
发布2024-04-19 14:22:08
1.6K0
发布2024-04-19 14:22:08
举报
文章被收录于专栏:石云升

最近吴恩达教授在红杉资本的人工智能峰会(AI Ascent)上做了一次演讲,主要介绍了agent工作流。使用代理工作流可以显著提高AI的回复质量。好的agent工作流可以让3.5模型效果高于4.0的回复。

吴恩达提出了四种AI Agent设计模式,包括:

  1. 检查(Reflection):通过让AI模型自我检查以提高代码质量。
  2. 工具使用(Tool use):AI模型使用各种工具来执行操作、收集信息。
  3. 规划(Planning):AI代理进行复杂的规划算法,如失败规避。
  4. 多智能体协作(Multiagent collaboration):不同AI代理协作完成任务,如开发游戏。

自从用了工作流之后,我每次写提示词都会尝试用工作流来写。这里说说我对吴恩达教授介绍的四种agent模式的理解。

1. 检查(Reflection)

就是让AI来检查AI的输出,举个例子:

Step 1:你是一名专业的Python研发人员,你现在正在写一个脚本,该脚本可以自动识别world文件、pdf文件里的第一行文本,并把该文本用作文件的文件名。

Step 2: 你把写好的脚本给到了你的上司,一位资深的Python研发专家。他审查了你的代码,对性能、安全性和结构的全面评估,给出了修改建议。

Step 3: 你根据上司的建议,修改了代码并输出。

这种输出代码的质量,比你定义一个角色区输出效果要好很多。而且它还能规避很多你意想不到的问题。

2. 工具使用(Tool use)

我一开始是以为让AI去调用某些插件,后面我发现很多AI做不到。所以,我现在的理解是我们要善于使用各种生产力工具。比如,编码可以使用copilot。在GPT plus里就是各种插件。比如做数据分析的插件,做网络搜索的插件等。或者是说可以让AI运用已经很成熟的一些理论公式啥的。这样输出效果也会很好。比如让AI运用SWOT分析法分析某个行业。

3. 规划(Planning)

规划就是把一个复杂的事情分拆成多个步骤去执行。吴恩达老师举的例子:

Request:Please generate an image where a girl is reading a book,and her pose is the same as the boy in the image example.jpg,then please describe the new image with your voice.

大概意思是识别图片中男孩的姿势,然后生成一张女孩在读书的图。女孩的姿势和男孩一样。最后用语音描述这幅新生成的图片。这个在一个AI工具里是做不到的。但是在comfyui里是可以做到的。写到这里,我好像又理解让AI使用工具的意思了,应该是在comfyui这类集成工具里让AI善于调用其它工具。

4. 多智能体协作(Multiagent collaboration)

举个例子:请你扮演一个电商公司的2个不同角色,一个名字叫张三是运营总监,一个名字叫李四是产品总监。

step 1:张三先提出一个创意:搞一个拉新比赛,奖金1万元,给拉新人数最多得5000,2-3名平分3000,4-10名平分2000。

step 2 : 李四拿到方案后,给出反馈意见,并且给出优化后的作品。

不断重复这个过程,至少双方有5次相互反馈和优化的过程。最终输出一个完整的,在预算范围内,能最大程度获得最多注册量的营销方案。

你会发现,经过多轮来回沟通完善后,这个输出的方案会比你最开始的方案要好很多。而且,我们还可以定义更多的角色参与这个过程。

我们也可以想想,既然我们可以让一个人用很久的时间完成一个事情。那么我们也可以让AI用相对长的时间去完成一件事情。现在的这种即时反馈很好,未来那种一天后,几天后给你反馈,只要结果更好,我们也不是不能接受的,对吧。

完整的演讲视频链接:https://www.bilibili.com/video/BV1rm41167zX

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 石云升 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人工智能与机器学习
提供全球领先的人脸识别、文字识别、图像识别、语音技术、NLP、人工智能服务平台等多项人工智能技术,共享 AI 领域应用场景和解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档