腾讯近日宣布开源其混元3D生成模型系列的两项新成果——混元 3D-Omni 与混元3D-Part,旨在推动 3D 内容生成在 AR/VR、游戏、动画等领域的实际应用落地。
作为业界首个支持多模态控制的统一 3D 生成框架,混元 3D-Omni 突破了传统方法对单张图像输入的依赖。该模型能够同时接入四类控制信号,包括骨骼、点云、边界框和体素,从而实现对生成物体几何结构、比例和姿态的精细调控。例如,在动画制作中,可通过骨骼信息精准控制角色动作;结合点云数据,则能有效改善单视角图像存在的遮挡或模糊问题,提升模型的几何准确性。这一设计显著增强了 3D 生成的可控性与实用性,也为其在虚拟现实、工业设计等复杂场景中的应用提供了可能。
混元 3D-Part 则专注于 3D 模型的组件化生成,该技术能够将整体模型智能拆分为多个可独立编辑的部件,使生成过程“像拼乐高一样”灵活。例如,在游戏开发中,汽车可拆分为车身、轮胎等部件,方便分别进行动画绑定;在 3D 打印领域,分段打印也能有效降低成品变形风险。该方法基于 P3-SAM 分割模型与 X-Part 组件生成模型协同工作,支持生成 50 种以上合理结构的组件,输出模型具备高可编辑性与生产适用性。
腾讯此次将两个模型的推理代码和权重全面开源,免费向社区开放,旨在降低 3D 生成技术的使用门槛,助力学术研究及产业部署的进一步探索。