近日,专注于视觉内容生成的模型公司 Stability AI 宣布与华人团队 VAST 开发 Tripo SR,这是一种受 LRM 启发的可单图生成 3D 的 AI 模型,旨在满足娱乐、游戏、工业设计和建筑专业人士不断增长的需求,并提供用于可视化详细3D对象的响应式输出。
TripoSR 可以在其他模型的一小部分时间内创建详细的 3D 模型。在 Nvidia A100 上测试时,TripoSR 在大约 0.5 秒内生成草稿质量的 3D 输出(纹理网格),优于其他开放的图像到 3D 模型,如 OpenLRM。除了速度之外,TripoSR 对使用或不使用 GPU 的用户都是完全可访问的。
Stability AI 表示:“我们的训练数据准备采用了多种数据渲染技术,这些技术能够更紧密地复制现实世界中图像的分布,显著提高了模型的泛化能力。我们为训练数据精心策划了一个更高质量的 Objaverse 数据集子集训练数据,从而让 TripoSR 可以更接近地复制现实世界中的图像分布,显著提高模型的泛化能力。在模型方面,我们还在基本 LRM 模型的基础上引入了多项技术改进,包括通道数优化、掩模监控和更高效的裁剪渲染策略。”
领取专属 10元无门槛券
私享最新 技术干货