Sora大模型不断迭代,一次次成为科技领域热搜的焦点。对于Sora大模型工作原理,复旦大学计算机学院教授、中工互联首席科学家张奇讲出了自己的看法:
Sora大模型正式发布前,视频生成技术的研究实际上孕育已久。早期成果大多局限于非常短的视频领域,几秒钟而已,难以彰显真正的突破性进展。
图:Sora搅动AI一池春水
Sora大模型发布之后,核心争议在于,Sora是否最终实现了对物理世界的全面建模?正如周鸿祎先生所言,若是如此,其对推动通用人工智能(AGI)的进程将产生深远的影响。
传统大语言模型基于文本训练,难以涵盖诸如“水从倾斜杯中流出”之类的日常常识。而视频数据的加入,有望完善世界模型在此方面的不足。这正是Sora给我们所带来的重要启示和可能性。
但我个人认为,Sora目前所做的,更多是从大量视频数据中学习统计上的“相关性规律”,而未真正实现“建模物理世界”。
举例来说。所有的视频知识里面呈现的是,在99%的情况下,我们看到的是苹果从树上往下掉落。Sora自然而然地学会了苹果落地的相关性,却未必可以洞见万物遵循的普适定律。
图:中工互联首席科学家张奇教授
领取专属 10元无门槛券
私享最新 技术干货