Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【他山之石】LLM+P:赋予大型语言模型规划能力

【他山之石】LLM+P:赋予大型语言模型规划能力

作者头像
马上科普尚尚
发布于 2024-05-06 06:53:12
发布于 2024-05-06 06:53:12
72203
代码可运行
举报
运行总次数:3
代码可运行

“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件,编程技巧等,开辟“他山之石”专栏,助你乘风破浪,一路奋勇向前,敬请关注!

大型语言模型(LLMs)已经展示了显著的零样本泛化能力,最先进的聊天机器人能够对日常生活中的常见问题给出合理的回答。然而,目前为止,LLMs并未能可靠地解决长期规划问题。相反,一旦以一种规范的方式给出问题,传统的规划方法就能够运用有效的搜索算法快速找到正确的,甚至是最优的解决方案。为了把这两者的优势结合起来,本文提出了LLM+P,这是第一个将传统规划方法的优点整合到LLMs的框架中。LLM+P接收一个用自然语言描述的规划问题,然后返回一个以自然语言表述的,解决该问题的正确(或最优)方案。LLM+P首先将语言描述转化为一个用规划领域定义语言(PDDL)编写的文件,然后利用传统规划方法快速找到解决方案,最后将找到的解决方案翻译回自然语言。此外,我们还定义了一组取自常见规划场景的基准问题。通过在这些基准问题上进行全面的实验,我们发现LLM+P能够为大多数问题提供最优解决方案,而LLMs在大多数问题上却无法提供可行的方案。

PDDL介绍

Planning Domain Definition Language (PDDL) 是一种用于描述人工智能规划问题的语言。它包括领域定义和问题定义两个部分。

领域定义描述了可能的动作和它们的效果,每个动作都有一些前提条件,这些条件必须满足才能执行该动作,以及每个动作的效果,描述了动作执行后世界的状态如何改变。

问题定义描述了一个具体的规划问题,包括初始状态和目标状态。初始状态描述了规划问题开始时世界的状态,而目标状态描述了我们希望达到的状态。

例如,一个简单的"搬箱子"问题可以这样描述:

领域定义:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(define (domain move)
  (:requirements :strips)
  (:predicates (robot-at ?x) (box-at ?x) (goal-at ?x))
  (:action move-robot :parameters (?from ?to) :precondition (robot-at ?from) :effect (and (not (robot-at ?from)) (robot-at ?to)))
  (:action move-box :parameters (?from ?to) :precondition (and (robot-at ?from) (box-at ?from)) :effect (and (not (box-at ?from)) (box-at ?to) (not (robot-at ?from)) (robot-at ?to)))
)

问题定义:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(define (problem move-1)
  (:domain move)
  (:objects location1 location2 location3)
  (:init (robot-at location1) (box-at location2) (goal-at location3))
  (:goal (and (box-at location3)))
)

这个例子中,机器人和箱子可以在不同位置移动,目标是将箱子移动到目标位置。

然后,我们可以使用规划器,如 Fast Downward,来求解这个问题。Fast Downward 是一个非常知名的规划器,它使用了一种名为"因果图"的数据结构来帮助搜索解决方案。Fast Downward 接受 PDDL 描述的问题作为输入,然后使用各种搜索策略和启发式方法来寻找一个解决方案,即一系列的动作序列,这些动作将系统从初始状态引导到目标状态。

PDDL的优点是可扩展性强,但处理连续动作或状态、不确定效果或不完全信息的能力有限。

文章提出的方法

本节首先使用一个实际的例子探讨如何以PDDL的形式构建规划提示,然后介绍LLM+P方法。

用LLM写PDDL

虽然LLMs在规划(或者说长期推理)方面表现得不尽人意,但它们在描述和翻译文本输入方面,包括以PDDL格式重写规划提示,方面做得很好。直观上,我们可以将PDDL视为一种不同于英语的语言,所以将规划提示以PDDL的形式重写其实就是一项“机器翻译”的任务,这是LLMs擅长的领域。这里我们提供了一个由GPT-4写就,没有进行任何优化的PDDL问题文件示例。我们可以看到,生成的文件似乎遵循了正确的PDDL语法,但使用了一个虚构的谓词(empty),并且漏掉了b1在桌子上的初始条件。

上下文学习

LLMs已经展示出了在不进行微调的情况下进行上下文学习的能力。上下文学习,指的是LLMs仅通过对一些输入-标签对(示例)的条件化,就能执行未见过的下游任务的能力。这里我们提供了一对用自然语言和PDDL描述的问题,作为GPT-4的上下文。当我们将这个上下文与上述示例中的提示结合起来时,生成的PDDL问题文件可以直接由规划器解决。

大型语言模型 + 传统规划方法 (LLM+P)

在介绍了LLM将问题以PDDL编码和上下文学习的能力后,我们现在准备介绍所提出的LLM+P解决方案(见图1的底部)。具体来说,我们假设对于每个问题领域,一个人类专家可以提供一个领域描述(也就是说,动作的先决条件和效果),这个描述将对该领域中出现的所有问题实例起到固定的作用。虽然自动生成这个描述的问题是另一个有价值的研究课题,但在这项提出的工作中,我们假设这个描述是以一个PDDL领域文件的形式存在的。LLM+P方法可以直接应用为给机器人系统指定任务的自然语言接口。例如,假设我们想要一个机器人扮演酒保的角色来制作鸡尾酒。告诉它可以执行哪些动作是合理的,但让它自己推断如何最有效地利用一组要组合的配料来制作新的鸡尾酒。此外,我们假设该代理人提供了一个最小的示例,演示了在该领域中一个简单问题的PDDL形式是什么样的。接下来,代理人提供了一个新的(可能非常复杂的)问题(P)。然后,LLM利用上下文学习来推断出与P对应的PDDL问题文件。一旦生成了问题的PDDL文件,我们将其与提供的领域PDDL文件一起输入到任何经典的规划方法中,生成一个PDDL方案。最后,LLM将PDDL方案翻译回自然语言,完成了LLM+P的流程。

总结来说,LLM+P的假设是:

  1. 聊天机器人能够根据与人类用户的对话,知道何时触发LLM+P。
  2. 对于用户提出的问题,提供了一个领域的PDDL文件。
  3. 提供了一个简单问题的自然语言描述和其对应的PDDL文件
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。
收藏,分享、在看,给个三连击呗
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能前沿讲习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【最全总结,建议收藏】一文看懂LLM / 智能体 / 工作流 和 MCP
长期跟踪关注统计学、机器学习算法、深度学习、人工智能、大模型技术与行业发展动态,日更精选技术文章。回复机器学习有惊喜资料。
Ai学习的老章
2025/06/08
3370
【最全总结,建议收藏】一文看懂LLM / 智能体 / 工作流 和 MCP
AAAI 2024 | 大模型(LLM)论文总结
大语言模型作为近期最火热的研究点,热度至今居高不下。特别是近期,arxiv上每个月都发表很多关于大语言模型的文章。对此,我只想吐槽一句,根本读不完。倒不如来看看在AAAI-2024会议上关于大语言模型的研究工作。经过"老字号"AAAI会议审核过的,质量是杠杠的。
时空探索之旅
2024/11/19
6380
AAAI 2024 | 大模型(LLM)论文总结
微软 & CMU - Tag-LLM:将通用大语言模型改用于专业领域
Github 地址:https://github.com/sjunhongshen/Tag-LLM
叶庭云
2024/05/25
3850
微软 & CMU - Tag-LLM:将通用大语言模型改用于专业领域
LLM4Rec:当推荐系统遇到大语言模型
大模型LLM在越来越多的领域开始崭露头角,前段时间我们整理了大模型在推荐系统中的应用 survey,当时留了一些坑没填上,今天补上。
NewBeeNLP
2024/01/17
3.5K0
LLM4Rec:当推荐系统遇到大语言模型
联邦语言模型:边缘SLM+云LLM
联邦语言模型是一个利用了两种人工智能趋势的想法:小型语言模型 (SLM) 和大型语言模型 (LLM) 能力的提升。
云云众生s
2024/07/14
4140
联邦语言模型:边缘SLM+云LLM
利用规划图提高经典人工智能规划复杂度
在状态空间搜索中,初始世界状态通过应用适当的操作进行多次转换,直到找到一个解决方案以达到目标或搜索算法终止并返回失败。我们可以使用诸如BFS、DFS、Dijkstra、A*等搜索算法。
黄博的机器学习圈子
2021/07/07
5760
利用规划图提高经典人工智能规划复杂度
一文带你了解基于大模型的Agent
在当前信息时代,大型语言模型(Large Language Models,LLMs)的发展速度和影响力日益显著。大模型强大的推理以及生成能力成为了搭建智能体的最好的组件。本内容来源于Datawhale的开源的“生成大模型基础(so-large-lm)”,一个致力于探索和理解大型模型发展的前沿课程:https://github.com/datawhalechina/so-large-lm
Datawhale
2024/04/24
1.6K0
一文带你了解基于大模型的Agent
2024!深入了解 大语言模型(LLM)微调方法(总结)
众所周知,大语言模型(LLM)正在飞速发展,各行业都有了自己的大模型。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。
ShuYini
2024/02/23
8.3K0
2024!深入了解 大语言模型(LLM)微调方法(总结)
大型语言模型的幻觉研究|减轻及避免大模型LLM幻觉(二)
“ 本文及上一篇综述了最近关于语言模型中幻觉问题的研究进展,主要集中在ChatGPT发布后的研究。文章讨论了如何评估、追踪和消除幻觉,并探讨了现有挑战和未来方向。希望本文能为对LLM幻觉问题感兴趣的朋友提供有价值的资源,促进LLM的实际应用。”
技术人生黄勇
2024/07/19
8460
大型语言模型的幻觉研究|减轻及避免大模型LLM幻觉(二)
基于LLM的异构多机器人操作系统EMOS的深度解析
论文提出了一种名为EMOS(Embodiment-aware Heterogeneous Multi-robot Operating System)的新型多智能体框架,旨在解决异构多机器人系统(HMRS)中物理形态感知缺失的核心问题。传统LLM-based多智能体系统依赖人工角色分配,而EMOS通过自动生成"机器人简历"(Robot Resume)动态描述机器人硬件能力,并结合分层任务规划机制实现协作。
一点人工一点智能
2025/04/10
1760
基于LLM的异构多机器人操作系统EMOS的深度解析
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%
2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。
机器之心
2025/05/21
1260
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%
代码增强LLM!UIUC | 概述将代码数据加入LLM训练数据中的各种好处
大模型时代的语言模型(LLM)不仅在尺寸上变得更大了,而且训练数据也同时包含了自然语言和形式语言(代码)。作为人类和计算机之间的媒介,代码可以将高级目标转换为可执行的中间步骤,具有语法标准、逻辑一致、抽象和模块化的特点。
ShuYini
2024/01/31
5270
代码增强LLM!UIUC | 概述将代码数据加入LLM训练数据中的各种好处
2024年6月上半月30篇大语言模型的论文推荐
大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。
deephub
2024/07/01
6790
2024年6月上半月30篇大语言模型的论文推荐
【论文解读】针对机器人技术的大模型
大型语言模型(LLM)经历了显著的发展,并越来越多地跨各个领域集成。值得注意的是,在机器人任务规划领域,LLM利用其先进的推理和语言理解能力,基于自然语言指令制定精确和高效的行动规划。然而,对于机器人与复杂环境交互的具体化任务,由于与机器人视觉感知缺乏兼容性,纯文本LLM经常面临挑战。本研究提供了一个新兴的LLM和多模态LLM集成到各种机器人任务的全面概述。此外,论文还提出了一个利用多模式GPT-4V,通过结合自然语言指令和机器人视觉感知来增强具身任务规划的框架。基于不同数据集的结果表明,GPT-4V有效地提高了机器人在具体化任务中的性能。对各种机器人任务中的LLM和多模态LLM的广泛调查和评估丰富了对以LLM为中心的具身智能的理解,并为弥合人类-机器人-环境交互中的差距提供了前瞻性的见解。
合合技术团队
2024/06/06
3120
【论文解读】针对机器人技术的大模型
当 LLMs 步入3D世界,通过多模态大语言模型对3D任务的调查和元分析 !
大型语言模型的出现标志着自然语言处理领域的一个变革性时代,使机器能够以前所未有的方式理解、生成和与人类语言互动。然而,作者周围的现实世界本质上是三维的,理解三维空间环境对于涉及在这些三维空间内进行感知、导航和交互的许多现实世界应用至关重要。随着近期的发展,LLM的应用已经远远超出了文本领域。将LLM与3D数据结合为计算模型理解和与物理世界互动提供了独特的机会,从而在包括自主系统、增强现实、机器人导航和机器人操作在内的多个领域引发创新。
AIGC 先锋科技
2024/07/31
5560
当 LLMs 步入3D世界,通过多模态大语言模型对3D任务的调查和元分析 !
超越 Transformer局限,优化思维链Prompt以提升大型语言模型的推理能力 !
大型语言模型(LLMs)的出现标志着自然语言处理和人工智能进入了一个新时代。这些模型在各种领域表现出惊人的能力,在知识检索和表达(张等人,2024年)等任务上实现了接近人类的性能。然而,关于它们的推理能力的担忧已经出现。这些任务范围从基本的操作如计数、排序和乘法,到更复杂的挑战如数学问题求解、算法设计和编程。以前的研究已经探讨了导致这些推理缺陷的各种因素,包括训练优化, Token 化方法,和数据集选择(杨等人,2024年)。在这些因素中,模型的结构在确定其推理能力方面起着关键作用。大多数主流LLM的核心架构——Transformer(有限精度)——与计算深度(Li等人,2024年)有关固有的限制。具体而言,Transformer中的注意力机制只能执行固定数量的连续计算步骤,导致_恒深度_建模。因此,仅依赖Transformer的_内部推理_,模型的可计算性受到限制,只能解决TC(Li等人,2024年;Feng等人,2024年)的复杂度和长度有限的问题(图1.c-d)。
未来先知
2025/01/15
1710
超越 Transformer局限,优化思维链Prompt以提升大型语言模型的推理能力 !
一文详尽之LLM-Based Agent
知乎链接:https://zhuanlan.zhihu.com/p/13905150871
Datawhale
2025/02/05
9620
一文详尽之LLM-Based Agent
PromptAgent: 利用语言模型进行策略规划实现专家级提示优化
提示工程旨在为大型语言模型(LLMs)制定有效的提示,以发挥其全部潜力。近期的自动提示工程,即提示优化,通过利用LLMs的内部状态或梯度,成功地研究了训练软提示或搜索离散令牌的最佳组合。对于如 GPT-4 这样的尖端、专有API基础的LLMs,提示工程很大程度上依赖于某种特定的人机交互。因此,人类提示专家需要将领域知识和对LLMs的直觉相结合,以设计最有效的提示,这可能包括任务描述、领域知识、解决方案指导等,这些都能显著提高提示的质量和性能。
用户1324186
2024/02/21
8270
PromptAgent: 利用语言模型进行策略规划实现专家级提示优化
当下大语言模型(LLM)应用的架构介绍
想要构建你的第一个大语言模型应用?这里有你需要了解的一切,以及你今天就能开始探索的问题领域。
轩辕镜像
2024/09/29
4380
当下大语言模型(LLM)应用的架构介绍
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
机器之心报道 机器之心编辑部 为什么仿佛一夜之间,自然语言处理(NLP)领域就突然突飞猛进,摸到了通用人工智能的门槛?如今的大语言模型(LLM)发展到了什么程度?未来短时间内,AGI 的发展路线又将如何? 自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。因此,开发能够理解和精通语言的强大 AI 算法面临着巨大挑战。过去二十年,语言建模方法被广泛用于语言理解和生成,包括统计语言模型和神经语言模型。 近些年,研究人员通
机器之心
2023/04/06
1.4K0
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
推荐阅读
相关推荐
【最全总结,建议收藏】一文看懂LLM / 智能体 / 工作流 和 MCP
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验