Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟

Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟

作者头像
机器之心
发布于 2025-02-14 08:24:02
发布于 2025-02-14 08:24:02
740
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:小舟

ChatGPT 强大问答能力的影响,大型语言模型(LLM)提供商往往优化模型来回答人们的问题,以提供良好的消费者体验。

随着智能体研究日趋成熟,优化似乎有了新的方向。

人工智能著名学者、斯坦福大学教授吴恩达今天指出:「现在有一种趋势是优化模型以适应智能体工作流程,这将为智能体性能带来巨大提升」,并撰写一篇博客简单阐述了这种趋势。

我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:

继 ChatGPT 在回答问题方面取得突破性成功之后,许多 LLM 的开发都集中在提供良好的消费者体验上。因此,LLM 被调整为回答问题或遵循人类提供的指令。指令调整指导模型的数据集很大一部分可以为人类编写的问题和指令提供更有用的答案,面向 ChatGPT、Claude、Gemini 等等。

但智能体工作负载不同,人工智能软件不是直接为消费者生成响应,而是应该在迭代工作流程中:

  • 反思自己的输出;
  • 使用工具;
  • 编写规划;
  • 在多智能体环境中进行协作。

主要模型制造商也越来越多地优化用于 AI 智能体的模型。

以工具使用(或函数调用)为例。如果 LLM 被问及当前天气,它将无法从训练数据中获取所需的信息。相反,它可能会生成 API 调用请求以获取该信息。甚至在 GPT-4 原生支持函数调用之前,应用程序开发人员就已经使用 LLM 来生成函数调用,通过编写更复杂的提示来告诉 LLM 哪些函数可用,然后让 LLM 生成用于确定是否要调用函数的字符串。

在 GPT-4 之后,生成此类调用变得更加可靠,然后许多其他模型本身就支持函数调用。如今,LLM 可以决定调用函数来搜索信息以进行检索增强生成 (RAG)、执行代码、发送电子邮件、在线下订单等等。

最近,Anthropic 推出了升级版的 Claude 3.5 Sonnet,能像人一样使用计算机。这意味着 LLM 原生使用计算机方向向前迈出了一大步,将帮助许多开发人员。一些团队还致力于让 LLM 使用计算机构建新一代 RPA(机器人流程自动化)应用程序。

随着智能体工作流程的成熟,我看到的是:

  • 首先,许多开发人员正在 prompt LLM 来执行他们想要的智能体行为。这样可以进行快速、丰富的探索!
  • 在极少数情况下,开发非常有价值的应用程序的开发人员将微调 LLM,以更可靠地执行特定的智能体功能。例如,尽管许多 LLM 本身支持函数调用,但它们是通过将可用函数的描述作为输入,然后(希望)生成输出 token 以请求正确的函数调用来实现这一点的。对于生成正确函数调用非常重要的任务关键型应用程序,针对应用程序的特定函数调用微调模型可显著提高可靠性。(但请避免过早优化!我仍然看到太多团队在进行微调,而他们可能应该在采取这种做法之前花更多时间进行 prompt。)
  • 最后,当诸如工具使用或计算机使用之类的能力对开发人员来说似乎很有价值时,主要的 LLM 提供商正在将这些能力直接构建到他们的模型中。尽管 OpenAI o1-preview 的高级推理对消费者有帮助,但我预计它对于智能体推理和规划会更有用。

大多数 LLM 都针对回答问题进行了优化,主要是为了提供良好的消费者体验,我们已经能够将它们「移植」到复杂的智能体工作流程中,以构建有价值的应用程序。为支持智能体中的特定操作而构建 LLM 的趋势将为智能体性能带来很大提升。我相信,在未来几年内,在这个方向上将实现巨大的智能体能力提升。

原文链接:

https://www.deeplearning.ai/the-batch/issue-275/

© THE END

转载请联系本公众号获得授权

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
PySide6 GUI 编程(4):使用 Slot 装饰器定义槽函数
bowenerchen
2024/05/20
5831
PySide6 GUI 编程(4):使用 Slot 装饰器定义槽函数
PySide6 GUI 编程(38):信号拦截与 lambda 槽函数
在之前的文章:PySide6 GUI 编程(3):信号槽机制中已经探讨过关于自定义信号的场景。在一些更追求灵活性的场景下,我们需要自定义信号,以此触发更多自定义的行为。
bowenerchen
2024/08/31
9660
PySide6 GUI 编程(38):信号拦截与 lambda 槽函数
PySide6 GUI 编程(3):信号槽机制
信号的重载在 PySide6 中并不推荐使用,对于从 QT5 遗留的代码可以继续使用这一能力。
bowenerchen
2024/05/19
6191
PySide6 GUI 编程(3):信号槽机制
PySide6 GUI 编程(30):其他常见对话框
bowenerchen
2024/08/21
2212
PySide6 GUI 编程(30):其他常见对话框
PySide6 GUI 编程(40):MVC 设计原则下QListView的使用
代码应该遵循MVC(模型-视图-控制器)设计原则,将数据模型、视图和控制器分离,以便于维护和扩展。
bowenerchen
2024/09/01
4031
PySide6 GUI 编程(40):MVC 设计原则下QListView的使用
PySide6 GUI 编程(29):QWizard 的简单示例
bowenerchen
2024/08/21
2303
PySide6 GUI 编程(29):QWizard 的简单示例
PySide6 GUI 编程(6):QPushButton的使用
bowenerchen
2024/07/20
4622
PySide6 GUI 编程(6):QPushButton的使用
PySide6 项目开发全攻略:打造你的文件重命名神器
家人们,今天来给大家唠唠如何用 PySide6 打造一个超实用的文件重命名工具。这篇文章适合想搞点 GUI 开发的 Python 小白,也能帮有经验的大佬查漏补缺。话不多说,咱们开整!
小码农薛尧
2025/02/08
1090
PySide6 项目开发全攻略:打造你的文件重命名神器
PySide6 GUI 编程(48): 基于Matplotlib绘制函数曲线
Matplotlib 似乎对中文的支持不太好,如果有中文字符要展示的话可能会乱码?
bowenerchen
2024/09/19
6431
PySide6 GUI 编程(48): 基于Matplotlib绘制函数曲线
Python 图形界面框架 PyQt5 使用指南!
使用Python开发图形界面的软件其实并不多,相对于GUI界面,可能Web方式的应用更受人欢迎。但对于像我一样对其他编程语言比如C#或WPF并不熟悉的人来说,未必不是一个好的工具。
快学Python
2021/12/13
8.6K0
Python 图形界面框架 PyQt5 使用指南!
PySide6 GUI 编程(32):QMouseEvent 鼠标事件
bowenerchen
2024/08/23
4701
PySide6 GUI 编程(32):QMouseEvent 鼠标事件
PySide6 GUI 编程(47): 基于QProcess运行外部命令
QProcess 可以用来启动外部程序。这在需要从 Qt 应用中运行第三方工具或命令行程序时非常有用。例如,一个图形用户界面(GUI)应用可能需要调用一个命令行工具来处理数据或执行某些操作。
bowenerchen
2024/09/18
3312
PySide6 GUI 编程(47): 基于QProcess运行外部命令
PySide——Python图形化界面入门教程(三)
PySide——Python图形化界面入门教程(三)          ——使用内建新号和槽               ——Using Built-In Signals and Slots 上一个教程中,我们学习了如何创建和建立交互widgets,以及将他们布局的两种不同的方法。今天我们继续讨论Python/Qt应用响应用户触发的事件:信号和槽。 当用户执行一个动作——点击按钮,选择组合框的值,在文本框中打字——这个widget就会发出一个信号。这个信号自己什么都不做,它必须和槽连接起来才行。槽是一个接
ascii0x03
2018/04/12
2K0
PySide6 GUI 编程(27):QFileDialog的简单使用
bowenerchen
2024/08/21
3931
PySide6 GUI 编程(27):QFileDialog的简单使用
PySide6 GUI 编程(19):QStackedWidget的简单用法
bowenerchen
2024/07/30
2810
PySide6 GUI 编程(19):QStackedWidget的简单用法
PySide6 GUI 编程(26):QInputDialog的简单使用
bowenerchen
2024/08/19
4061
PySide6 GUI 编程(26):QInputDialog的简单使用
PySide6 GUI 编程(24):QDialog以及QDialogButtonBox
QDialog 自身运行时会触发一个事件循环, 这个事件循环与 QApplication 的事件循环并没有显著的从属关系,可以认为它们是独立的。
bowenerchen
2024/08/08
5342
PySide6 GUI 编程(24):QDialog以及QDialogButtonBox
Python:PyQt学习
上面的代码把控件对应的变量名全部作为全局变量。如果要设计稍微复杂一些的程序,就会出现太多的控件对应的变量名。而且这样也不利于代码的模块化。所以,我们通常应该把 一个窗口和其包含的控件,对应的代码全部封装到类中,如下所示:
小简
2023/01/04
10.8K0
Python:PyQt学习
PySide6 项目开发全攻略:打造你的文件重命名神器
家人们,今天来给大家唠唠如何用 PySide6 打造一个超实用的文件重命名工具。这篇文章适合想搞点 GUI 开发的 Python 小白,也能帮有经验的大佬查漏补缺。话不多说,咱们开整!
小码农薛尧
2025/02/08
1000
PySide6 项目开发全攻略:打造你的文件重命名神器
Python GUI编程:如何运行第一个PySide2的窗体程序
上一章节介绍了PySide2的安装以及如何去启动程序进行页面设计,并且将工具集成到pycharm的扩展工具中去,有2个地方写的不对,用的是pyuic工具,需要改一下,改成pyside2-uic.exe。具体改动点:
小博测试成长之路
2021/07/29
9430
推荐阅读
相关推荐
PySide6 GUI 编程(4):使用 Slot 装饰器定义槽函数
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档