前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

作者头像
机器之心
发布于 2025-02-15 00:29:56
发布于 2025-02-15 00:29:56
1450
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

机器之心编辑部

这是生成式大模型的时代 —— 它们能生成文本、图像、音频、视频、3D 对象…… 而如果将所有这些组合到一起,我们可能会得到一个世界!

现在,不管是 LeCun 正在探索的世界模型,还是李飞飞想要攻克的空间智能,又或是其他研究团队提出的其它类似概念,我们都毫无疑问地在离这个世界越来越近。就在几个小时前,我们向着这个世界又跨出了一步:CMU 联合其他 20 多所研究实验室开源发布了一个生成式物理引擎:Genesis,意为「创世纪」。从名字也能看出,这或许真是一个新世界的起点。

据项目贡献者 CMU 机器人研究所博士生 Zhou Xian 和领导者淦创教授在 X 上分享的内容看,该项目耗费了 2 年多时间,海内外近 20 家机构参与了内部测试。

最终,这个联合团队得到的 Genesis 生成式物理引擎可以生成 4D 动态世界,而其基础是一个用于通用机器人和物理 AI 应用的物理模拟平台。

  • 开源地址:https://github.com/Genesis-Embodied-AI/Genesis
  • 项目页面:https://genesis-embodied-ai.github.io/
  • 文档地址:https://genesis-world.readthedocs.io/en/latest/

目前 Genesis 的技术论文还未发布,但据官方文档,Genesis 的主要特性包括:

  • 安装毫不费力,API 设计极其简单且用户友好。
  • 并行模拟的速度前所未有:Genesis 是世界上最快的物理引擎,模拟速度比现有的 GPU 加速的机器人模拟器(Isaac Gym/Sim/Lab、Mujoco MJX 等)快 10 到 80 倍(是的,这有点科幻),同时不会影响模拟准确性和保真度。
  • 支持各种 SOTA 物理求解器的统一框架,可建模各种材料和物理现象。
  • 具有经过性能优化的照片级真实感的光线追踪渲染。
  • 可微分性:Genesis 在设计时就考虑了与可微分模拟完全兼容。目前,其 MPM 求解器和工具求解器(Tool Solver)都是可微分的,其他求解器的可微分性也将很快添加(会从刚体模拟开始)。
  • 物理上精确且可微分的触觉传感器。
  • 原生支持生成式模拟,允许通过语言提示生成各种模态的数据:交互式场景、任务提议、奖励、资产、角色动作、策略、轨迹、相机动作、(物理上准确的)视频等。

此外,Genesis 还支持各种硬件和操作系统。

为了佐证 Genesis 的优越特性,Zhou Xian 在 X 上分享了一个例子:在单台 RTX4090 上,它的模拟速度比实时速度快大约 430,000 倍,仅需 26 秒就能训练完成一个可迁移到真实世界的机器人运动策略。

Zhou Xian 表示:「我们的目标是构建一个通用数据引擎,其能利用上层的生成式框架自动创建物理世界,以及各种模式的数据,包括环境、相机运动、机器人任务提议、奖励函数、机器人策略、角色运动、完全交互式 3D 场景、开放世界铰接资产等,从而自动生成用于机器人、物理 AI 和其他应用的数据。」

Genesis 一经宣布,就已收获好评无数。

GitHub 项目 star 数也在短短几个小时内突破了 1.5k。

Genesis:一个综合物理模拟平台

Genesis 是一个综合物理模拟平台,专为通用机器人、具身 AI 和物理 AI 应用而设计。它同时具有多种属性:

  • 一个从头开始重建的通用物理引擎,能够模拟广泛的材料和物理现象;
  • 一个轻量级的、超快的、Python 化的、用户友好的机器人仿真平台;
  • 一个强大和快速的逼真照片渲染系统;
  • 生成式数据引擎,将用户提示的自然语言描述转换为各种数据形式。

Genesis 由重新设计和重新构建的通用物理引擎提供支持,并将各种物理求解器及其耦合集成到一个统一的框架中。此核心物理引擎通过在更高级别运行的生成式智能体架构上得到进一步增强,旨在为机器人技术及其他领域实现全自动数据生成。

淦创教授介绍说:「我们的方法的核心是对人类心智模型进行逆向工程,并构建由生成式物理引擎驱动的机器人大脑!我意识到许多机器人专家对这种方法持怀疑态度,他们指出了设置模拟器和解决模拟-现实差距的困难。他们主张只专注于从现实世界的数据中学习。我理解这些担忧,但我坚信我们不能只是因为创建一个好模拟器很有挑战性就绕过它们!」

生成框架旨在自动生成数据,包括以下内容:

  • 物理准确且空间一致的视频;
  • 相机运动和参数;
  • 人类和动物角色运动;
  • 机器人操纵和运动策略,可部署到现实世界;
  • 完全交互式 3D 场景;
  • 开放世界铰接式物体生成;
  • 语音音频、面部动画和情绪。

目前,该研究正在开源底层物理引擎和模拟平台。在不久的将来,将逐步推出对生成框架的访问。

Genesis 性能卓越,效果惊艳

作为一个高度优化的物理引擎,Genesis 可以借助 GPU 加速并行运算,在各种场景中提供了前所未有的模拟速度。

在模拟操控(manipulation)场景时,Genesis 以 4300 万帧 / 秒的速度运行,比实时速度快 43 万倍。

在大规模模拟中,Genesis 利用「auto-hibernation」来加速处于收敛和静态实体的模拟。不过这项功能正在测试中,将在 0.1.1 版本中发布。

Genesis 与常用的基于 CPU 和 GPU 的机器人模拟器的速度比较。

Zhou Xian 表示,Genesis 的 GPU 并行化 IK(Inverse kinematics)求解器可以在 2 毫秒内完成 1 万台 Franka 机器臂的 IK 求解。

接下来,我们看看具体的示例展示。

生成 4D 动态和物理世界

Genesis 的物理引擎由基于 VLM 的生成式智能体提供支持,该智能体使用模拟基础设施提供的 API 作为工具来创建 4D 动态世界,然后将其用作提取各种模式数据的基础数据源。

结合生成相机和物体运动模块,Genesis 能够生成物理上精确且视图一致的视频和其他形式的数据。

并且,Genesis 还支持模拟各种不同的材料,包括刚体、铰接体、布料、液体、烟雾、可变形体、薄壳材料、弹性 / 塑性体、机器人肌肉等。

模拟一层巧克力酱,自然不再话下。

绞碎泡沫的质感看起来也非常真实。

星球与太空船的质感也非常高,看起来就像是来自一部大制作的科幻电影。

子弹击破水球的物理过程就好像真的是来自设备精良的高速摄影。

一壶字母糖,看起来很 Q 弹。

对充气人偶的模拟也恰到好处,同样也非常幽默地模拟现实状况。

角色动作生成

有了如此高质量的物理引擎,对于游戏制作业来说也是好消息,许多复杂的动作和效果都可以通过提示词来快速生成了:

提示:手持棍棒的迷你版悟空在桌面上飞奔 3 秒,然后跳到空中,落地时右臂向下摆动。镜头从他的脸部特写开始,然后稳定地跟随角色,同时逐渐缩小。当悟空跳到空中时,在跳跃的最高点,动作暂停几秒钟。镜头围绕角色 360 度旋转,然后缓慢上升,然后继续动作。

设计动作的时间成本一下子就被打下来了。

机器人策略生成

Genesis 可以利用生成式机器人智能体和物理引擎自动生成不同场景下各种技能的机器人策略和演示数据。这意味着研究人员可以在仿真环境中快速获得符合物理规律的机器人动作方案,并将其可靠地迁移到实体机器人上。

下面展示了一些不同形态的机器人执行不同任务的示例。

提示:一个移动的 Franka 机械臂使用碗和微波炉做爆米花

提示:宇树 Go2 四足机器人在雨中奔跑 (Sim)

比如,从提示词到在仿真环境中的动作策略,再迁移到实体机器人上,可以如此丝滑:

提示:宇树 H1-2 人形机器人向前行走 (Sim2Real)

做倒立需要精确平衡控制和全身协调,这么高难度的动作,现在也可以通过 Genesis 来实现 Sim2Real:

提示:四足机器人用前两条腿做倒立 (Sim2Real)

倒立不够,在 Genesis 的助力下,机器狗还能更快地学会「体操技巧」,稳稳地做两个直体后空翻:

四足机器人连着后空翻两次 (Sim2Real)

像拉椅子这样要和真实世界里的物体交互的动作,也没问题:

大型欠驱动机器人的运动操作 (Sim2Real)

3D 和完全交互式场景生成

Genesis 的生成框架支持生成 3D 和完全交互的场景,这些场景可用于训练机器人技能。

家庭室内场景,有客厅(包括用餐区)、卫生间、书房和卧室。

餐厅内部

开放世界铰接物体生成

Genesis 也能生成具有铰接结构的物体及其交互过程,例如汽车开关门、打开合上笔记本电脑、折叠金属刀片。

软体机器人

Genesis 还是首个为软肌肉和软机器人及其与刚性机器人的交互提供全面支持的平台。Genesis 还附带类似 URDF 的软机器人配置系统。官方还提供了一个相关教程:https://genesis-world.readthedocs.io/en/latest/user_guide/getting_started/soft_robots.html

Genesis 也能模拟带有软皮肤和刚性骨骼的混合机器人。

语音音频,面部表情和情绪生成

音频以及面部表情也是 Genesis 想要整合的模态,下面展示了两个示例:

人物情绪从中性转变为愤怒,然后再转变为快乐。

Genesis 将情绪的转变泛化到不同的面部

结语

最后,Zhou Xian 展示了一个用 Genesis 打造的俄罗斯方块游戏,其中的方块是果冻材质的,并且能以符合现实的物理规律运动。

我们以前可能也刷到过类似的视频,但那些是视频特效师们精心制作的结果,而现在 Genesis 已经可以一键导出,并进一步转化为真实可实现的技术突破。

淦创教授在 X 上分享了自己参与这个项目的经历:「自 2018 年以来,我决定将自己的研究重点从视觉转向具身 AI,因为我着迷于创建能够与物理世界和其他具有类似人类灵活性的智能存在交互的通用智能体——我们将这个领域称为具身 AGI(embodied AGI)。」

他还写到:「说实话,有时候我觉得这个模拟器可能太先进了,不能发布,但我们相信让它完全开源并围绕我们的使命建立一个强大的社区是至关重要的!请加入 Genesis 社区!我们希望让机器人学研究社区相信『Generative Physics Simulator is all You Need!』」」

不得不说,还真是让人非常期待 Genesis 的实际应用呢!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。如何将这种深度推理模型扩展到智能体和具身领域,让机器人通过思考和推理来完成复杂具身交互等任务?
机器之心
2025/04/27
1100
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果,Genesis 物理引擎开启新时代
在科技日新月异的今天,AI视频生成技术正在经历一场翻天覆地的变革。2024年12月,随着最先进的生成式物理引擎Genesis的发布,我们迎来了一个全新的时代。这个由顶尖学术和产业机构联手打造的成果,不仅能够以一句话为指令生成完整的模拟物理世界,而且其精确度和多功能性远超现有技术,标志着AI生成技术的一次重大飞跃。
AI研思录
2025/02/20
2080
刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果,Genesis 物理引擎开启新时代
创建可微物理引擎Nimble,开源SOTA人体骨骼模型,斯坦福腿疾博士生用AI「助跑」人生
有一位研究者,他身患残疾,出生时便患有退行性神经疾病,该疾病一直攻击着他的外周运动神经元(进行性神经性腓骨肌萎缩症, 2A 型)。他就是来自斯坦福大学的博士生 Keenon Werling。
机器之心
2021/09/06
7410
世界模型挑战赛,单项奖金10000美元!英伟达全新分词器助力下一帧预测
去年3月,挪威人形机器人公司1X拿到了OpenAI领投的2350万美元,今年初又完成了1亿美元的B轮融资。
新智元
2025/02/15
770
世界模型挑战赛,单项奖金10000美元!英伟达全新分词器助力下一帧预测
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
长久以来,相比于语言或者视觉模型可以在大规模的互联网数据上训练,训练机器人的策略模型需要带有动态物理交互信息的数据,而这些数据的匮乏一直是具身智能发展的最大瓶颈。
新智元
2023/11/07
4230
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
业界 | 3D 环境训练智能体时代来临?Facebook 开源仿真 3D 环境平台 Habitat
AI 科技评论按:Facebook AI 小组今日在博客开源了一个仿真 3D 环境平台 Habitat,该平台让我们可以在其中训练与评估 AI 智能体,正式宣告「3D 训练时代」来临。雷锋网将之编译如下。
AI研习社
2019/03/14
9590
业界 | 3D 环境训练智能体时代来临?Facebook 开源仿真 3D 环境平台 Habitat
Sora到底懂不懂物理世界?一场头脑风暴正在AI圈大佬间展开
和以往只能生成几秒钟视频的模型不同,Sora 把生成视频的长度一下子拉长到 60 秒。而且,它不仅能了解用户在 Prompt 中提出的要求,还能 get 到人、物在物理世界中的存在方式。
机器之心
2024/02/26
1540
Sora到底懂不懂物理世界?一场头脑风暴正在AI圈大佬间展开
英伟达机器人跳APT舞惊艳全网,科比C罗完美复刻!CMU 00后华人共同一作
‍以上这些还只是开胃菜,这款人形机器人还会侧跳、前跳、前踢、右踢,甚至能够完成深蹲、腿部拉伸等高难度动作。‍
新智元
2025/02/05
1420
英伟达机器人跳APT舞惊艳全网,科比C罗完美复刻!CMU 00后华人共同一作
MuJoCo要开源! DeepMind收购物理引擎MuJoCo,将推动全球机器人研发
昨天,DeepMind发帖,称已经收购了用于机器人研发的MuJoCo物理引擎,目前正致力于开源MuJoCo,并打算在2022年对所有人免费开放!
AI科技评论
2021/10/21
1.2K0
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
但Google DeepMind、UC伯克利和MIT的研究人员更进一步,在他们眼里,「大视频模型」也许能够像世界模型一样,真正的做到理解我们身处的这个世界。
新智元
2024/03/05
1500
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
Neo Gamma 让家庭人形机器人走入千家万户成为现实
1X Technologies(前身为Halodi Robotics)成立于2014年,总部位于挪威奥斯陆,专注于开发具备人类运动能力的通用人形机器人。
AIGC新知
2025/02/25
3010
Neo Gamma 让家庭人形机器人走入千家万户成为现实
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
最近,OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外,OpenAI 更是将 Sora 定义为一个「世界模拟器」(world simulators)。
机器之心
2024/03/18
1360
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命
Nvidia带着最新「黑科技」模型Cosmos-Transfer1震撼登场,可以创建高度逼真的模拟环境,反向生成「真实世界」!
新智元
2025/03/24
1700
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。在强化学习领域中,世界模型通常被建模为一个神经网络,通过历史状态和动作,预测未来可能出现的状态。其中,Dreamer 算法在多种模拟环境的成功表现让我们看到了世界模型优秀的表征和泛化能力。如果将世界模型应用于复杂真实场景,是否能够实现更好的控制决策呢?
机器之心
2025/02/25
1010
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
教机器人捏橡皮泥?MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab
机器之心专栏 作者:MIT CSAIL 「PlasticineLab」的提出,或为软体动力学领域的众多研究提供了新思路。 虚拟环境(ALE、MuJoCo、OpenAI Gym)极大地促进了在智能体控制和规划方面学习算法的发展和评估,然而现有的虚拟环境通常只涉及刚体动力学。尽管软体动力学在多个研究领域有着广泛的应用(例如,医疗护理中模拟虚拟手术、计算机图形学中模拟人形角色、机器人技术中开发仿生制动器、材料科学中分析断裂和撕裂),关于构建标准软体环境和基准的研究却很少。 与刚体动力学相比,软体动力学的模拟、控
机器之心
2023/03/29
6830
教机器人捏橡皮泥?MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab
英伟达全栈工具链如何重构Groot机器人开发链路(4)
英伟达全栈工具链如何重构Groot机器人开发链路(一) 英伟达全栈工具链如何重构Groot机器人开发链路(2) 英伟达全栈工具链如何重构Groot机器人开发链路(3)
GPUS Lady
2025/04/01
1250
英伟达全栈工具链如何重构Groot机器人开发链路(4)
一文全面了解目前具身智能的核心内容和未来发展
文章:Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI
点云PCL博主
2025/02/03
7490
一文全面了解目前具身智能的核心内容和未来发展
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。
机器之心
2025/02/15
740
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
元学习—Meta Learning的兴起
【导读】元学习描述了训练深度神经网络相关的更高级别的元素。在深度学习文献中,“元学习”一词经常表示神经网络架构的自动化设计,经常引用“ AutoML”,“少量学习”或“神经架构搜索”。OpenAI的魔方机器人手的成功源于诸如“通过梯度下降学习如何通过梯度下降学习”之类的可笑标题的论文,证明了该想法的成熟。元学习是推动深度学习和人工智能技术发展的最有希望的范例。
Amusi
2019/12/31
1.3K0
元学习—Meta Learning的兴起
独家|世界模拟器才是AGI终局,12态势预测!首席专家万字长文专业解读Sora里程碑
但是,Sora改变AI认知方式,开启走向「世界模拟器」的史诗级的漫漫征途,才是未来暴风眼,真正的重点。而世界模拟器,是远比AGI、具身智能、元宇宙更炸裂的智能未来。
新智元
2024/02/26
2460
独家|世界模拟器才是AGI终局,12态势预测!首席专家万字长文专业解读Sora里程碑
推荐阅读
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
1100
刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果,Genesis 物理引擎开启新时代
2080
创建可微物理引擎Nimble,开源SOTA人体骨骼模型,斯坦福腿疾博士生用AI「助跑」人生
7410
世界模型挑战赛,单项奖金10000美元!英伟达全新分词器助力下一帧预测
770
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
4230
业界 | 3D 环境训练智能体时代来临?Facebook 开源仿真 3D 环境平台 Habitat
9590
Sora到底懂不懂物理世界?一场头脑风暴正在AI圈大佬间展开
1540
英伟达机器人跳APT舞惊艳全网,科比C罗完美复刻!CMU 00后华人共同一作
1420
MuJoCo要开源! DeepMind收购物理引擎MuJoCo,将推动全球机器人研发
1.2K0
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
1500
Neo Gamma 让家庭人形机器人走入千家万户成为现实
3010
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
1360
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命
1700
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
1010
教机器人捏橡皮泥?MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab
6830
英伟达全栈工具链如何重构Groot机器人开发链路(4)
1250
一文全面了解目前具身智能的核心内容和未来发展
7490
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
740
元学习—Meta Learning的兴起
1.3K0
独家|世界模拟器才是AGI终局,12态势预测!首席专家万字长文专业解读Sora里程碑
2460
相关推荐
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档