OpenAI刚刚发布Sora没多久,让大家惊叹用AI创作视频已经这么容易了吗?Google马上推出了更惊人的AI模型 - Genie,110亿参数、生成式可交互的世界模型。可以让你自己创作电子游戏了。
不管你用提示词,还是图像,或者手绘的草图,还是用手机拍摄的照片,最后Genie都可以给你生成二维的游戏动画视频。关键它还是可交互的,你可以去操纵玩家。这等于瞬间实现了用文字或者图片生成电子游戏。
不得不说,OpenAI和Google这两家公司在AI领域的竞争是你追我赶啊。无论是OpenAI的Sora,还是这次Google公布的Genie,本质上都是想从视觉模型的角度去模拟我们的物理世界,从而走向通用人工智能。有趣的是,他们不约而同都采用了Visual Transformer模型。但是他们的用到的训练数据是不一样的:
OpenAI用了大量的真实视频数据去训练Sora,目标在生成符合我们世界的视频。但是Google的Genie其实用的是互联网在线的游戏视频来训练的,用到了20万小时的打游戏的视频,而且根本不需要人工的标注。
Genie的价值在于:可以用很少的成本去模拟我们的真实世界,然后让AI在一个模拟的世界中训练和学习,一旦建立了这样的迭代环境,AI可能会进化得非常快。
尽管Genie目前多少还是实验性质的,但是取得的进展非常鼓舞人心。它证明了通过AI来构建一个虚拟世界已经很接近了,而且AI通过视频的自我训练完全是可以学习到我们真实世界的物理规则的。也许,短短几年后,AI+机器人,真的会像智能手机那样普及呢。
领取专属 10元无门槛券
私享最新 技术干货