首页
学习
活动
专区
圈层
工具
发布

原力无限CTO王一舟:具身智能的真正壁垒不在本体,而在“大脑+AI Infra”

4月16日,在 GEIA Asia 2026 数据与模型论坛上,原力无限 CTO 王一舟发表主题演讲《原力觉醒:从智驾看具身,具身智能如何构建壁垒》。在这场面向亚太具身智能产业核心从业者的分享中,他给出的判断并不迎合热闹的行业情绪,而是试图把问题重新拉回到更关键的位置:今天的具身智能,真正需要补上的,是一个能够支撑规模化落地的大脑系统。

过去一年,具身智能与人形机器人迅速升温。展会、论坛、发布会密集出现,机器人开始越来越频繁地进入公众视野。本体形态不断丰富,动作演示越来越流畅,场景想象也越来越宏大。

但如果把视线从这些直观展示中抽离出来,就会发现,行业真正的难题并没有因为“更像机器人”而自动消失。王一舟在演讲中提出了一个非常直接的判断:当前具身智能行业最大的卡点,不是身体不够先进,而是“脑身割裂”。

所谓“脑身割裂”,并不是一个修辞性的概念,而是具身智能现阶段最真实的技术症结。今天的很多机器人,本体能力已经走得很快,硬件结构、运动控制、关节自由度、行走稳定性都在快速进步;但与之相对应的“大脑”系统,仍然没有真正建立起对物理世界的深层理解。机器人可以完成一些预设动作,也可以在限定条件下做出不错的演示,但一旦进入复杂、开放、长程、非标准化的真实环境,问题就会迅速暴露出来:可靠性不足,泛化能力不够,训练成本极高,部署后的持续进化也缺少闭环支撑

这也是为什么,行业里反复出现的摔倒、动作单一、任务切换困难、复杂操作成功率不稳定等现象,表面看是不同问题,本质上却都指向同一个根因——机器人有了越来越成熟的“身体”,却还没有真正成熟的大脑。

“脑身割裂”,才是现阶段具身智能的核心死结

在王一舟看来,如果只把具身智能理解为动作能力的叠加,或者把阶段性 Demo 误认为可规模化能力,那么行业很容易高估当前进展。因为动作生产本身,并不自动等于智能。机器人真正需要解决的,也从来不只是“做出一个动作”,更关键的是理解为什么这样做、下一步该做什么、这个动作会带来什么结果,以及在环境变化之后如何继续完成任务。

这也是原力无限始终坚持的一个基本判断:具身智能大脑不是某一个单点模型,不只是一个 VLA、一个世界模型,或一个 Agent,而是机器人完成“感知—理解—推理—预测—执行—学习”闭环的核心智能系统。

只有这个闭环成立,机器人才能从“会演示”走向“会工作”,从“能完成一次”走向“能够长期稳定完成”。

从智驾走到具身,方法论最大的启示不是积累,而是汰换

王一舟这次在 GEIA Asia 的分享,另一个很重要的价值,在于他并没有只从具身行业内部讨论具身,而是把视角拉回到了自己更熟悉的一条主线:自动驾驶。

从智驾走到具身,在他看来,这不是一次简单的跨赛道迁移,更像是一次方法论层面的重新审视。因为具身智能今天遇到的很多问题,智驾其实都曾经经历过:技术路线如何选择,数据体系如何建立,仿真与真实世界如何联动,工程系统如何形成闭环,模型能力如何从实验室走向规模部署

也正因为如此,王一舟在演讲中给出了一个鲜明判断:AI领域的方法论演进,很多时候不是“积累”,而是“汰换”。

回看智驾过去十年的发展路径,这一点尤其明显。从早期感知堆叠,到模块化深度学习,再到 3D 感知、BEV、端到端,直至今天更大规模的 VLM/VLA 整合,技术栈并不是在原地缓慢加法,而是在一次次路线更替中快速重写。旧方法常常不会只是被补充,而是直接被淘汰。对今天的具身智能来说,这个经验极其重要:如果在当前阶段误判真正的技术重心,很多投入最终都可能沉淀为很快贬值的成本。

智驾经验可以借鉴,但具身智能面对的是更复杂的真实世界

但智驾与具身并不相同。

王一舟在演讲中专门谈到,二者虽然在 AI Infra、数据闭环、训练体系等方面有大量共通的方法论,但具身智能面对的是一个更复杂的物理世界问题。智驾的核心任务,是在相对明确的交通规则和道路结构中完成感知与决策;具身要面对的,则是更加开放的环境、更加多样的对象、更加复杂的操作,以及更高密度的人机交互。

这直接导致两者在数据和模型上的难度并不处于同一层级。

例如,智驾的数据瓶颈更多在于自动标注体系如何持续升级,而具身的核心瓶颈之一,是高质量数据源本身就极难获取。智驾仿真更强调视觉层面的高保真,而具身仿真除了外观一致性之外,还必须处理物理属性、交互可行性、可操作性等更复杂的问题。再往后,智驾的数据闭环更偏向长尾问题发现与数据分布修正,而具身智能则更强依赖策略相关的数据训练,其训练配方本身也远比智驾更加复杂。

换句话说,具身并不能简单复用智驾的答案。但智驾给出的启示非常明确:真正能构成行业壁垒的,最终往往不止于某一次模型效果的领先,更关键的是有没有建立起一个可持续迭代的系统

原力无限的回答:用“具身大脑+AI Infra”重建闭环

这也是原力无限此次在 GEIA Asia 上希望表达的核心观点。今天讨论具身智能的壁垒,视线不能停留在本体,也不能只停留在模型,而要进一步看到“具身大脑 + AI Infra”能否形成完整闭环

在原力无限的技术框架中,“脑”与“基础设施”从来不是两个割裂模块,而是一个共同构成能力飞轮的整体。

在“脑”的部分,原力无限选择的是持续学习 VLA 与因果世界模型的融合路线。持续学习 VLA 解决的是机器人感知、理解与动作之间的统一建模问题,让机器人具备更强的技能形成与任务执行能力;因果世界模型解决的,则是未来状态预测、反事实推演与策略评估的问题,让机器人不只是“看到当前”,更能在行动前对结果做内部推演。

这条路线的重要性,在于它不再满足于让机器人做出反应,而是试图让机器人在动作发生之前,先在内部完成一次“想一遍”。

这看上去只是能力描述上的细微变化,实际上却对应着具身智能能否迈向更高可靠性和更低试错成本的关键分界线。因为在真实物理世界中,试错是昂贵的,重复试错更是不可持续的。机器人如果无法提前判断动作后果,就只能依赖高成本真机迭代;而一旦具备了预测、筛选和评估能力,很多学习与优化就可以前移到更高效的系统层完成。

这也是王一舟这次演讲里很重要的一句话背后的逻辑:与其让机器人在真机上反复试错,不如先打造真正理解世界的大脑

AI Infra不只是配套工程,而是具身智能时代的生产系统

与此同时,在“大脑”之外,原力无限把大量精力放在了更不显眼、但也更决定长期天花板的 AI Infra 上。

王一舟长期做智驾系统,对这一点感受非常深。因为任何一个真正想走向产业化的 AI 体系,最终都绕不过基础设施问题:数据怎么来,怎么治理,如何形成稳定分布;仿真怎么做,如何与真实世界联动;训练怎么复现,模型和数据如何实现血缘追踪;部署后的反馈如何再回流到下一轮训练

没有这些,所谓的模型领先往往只是暂时领先。

原力无限当前构建的全栈 AI Infra,核心就是把数据采集、仿真生成、模型训练、评测与部署真正串成一个持续运转的系统。在数据采集端,公司不再满足于传统低效的本体在环遥操作方式,而是采用更偏第一视角、自我中心的 Ego-centric 范式,提高长程复杂任务数据的生产效率;在仿真端,通过世界模型、重建模型与多模态模型协同推进 Real2Sim;在训练端,则沿袭智驾量产经验,构建训练 recipe 与可追溯的流水线系统,把“模型怎么训出来的”这件事工程化。

这些能力或许不像一个灵巧动作 Demo 那样直观,却更直接关系到技术体系能否持续迭代、持续演进。

这也是原力无限“一脑·多身·多场景”战略背后的逻辑。对于原力无限而言,具身智能的关键不只在于做出不同形态的机器人,更在于持续打磨背后的大脑系统与 AI Infra,让机器人真正具备理解世界、进入真实场景并持续进化的能力。这也是王一舟此次在 GEIA Asia 分享中的核心观点。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OTx2-rnbrDVo3_TFPxtKVc0Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券