观点网讯:2月10日,豆包大模型团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验模型“VideoWorld”正式开源。
该模型在业界首次实现无需依赖语言模型即可认知世界。
据了解,“VideoWorld”与Sora、DALL- E、Midjourney等主流多模态模型不同,其创新性在于完全基于视觉理解世界。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货