近期 OpenAI 推出了 Feather 功能,登录页面已经开放。根据官方说明,Feather 的主要用途是为企业用户提供数据标注和微调服务。
此外根据某位网友透露,DALL-E 3 模型即将增加 67 种图像风格,涵盖了主流的 Styles。DALL-E 3 还将增加设置功能,允许用户设置图像的精度、风格、图像生成数量和 CD 编码。
ChatGPT 方面则新增了语音播报功能,可以阅读生成的文本。此外 ChatGPT 还将增加聊天创意功能,并将知识库更新到了 2013 年 12 月。
Data Analysis 也会升级到 VR 版本。以上更新会在近期正式公开。
与此同时,Sora 发布了更多测试影片:Video generation models as world simulators (openai.com),再次刷新了人们对该模型的认知。这段视频发布在 Sora 的 TikTok 账号,描述了旧金山街头的第一视角赛车运动。我们可以看到,Sora 不但生成了长达 15 秒的连续运动画面,也显示了当前的天气和金门大桥效果,堪比虚幻引擎创建的 3D 游戏画面。
视频二滑板车上的小狗,完全看不出是 AI 生成的内容。
视频三是一段精致的微观场景,无论是人物的动作还是背景的立体感,都达到了很高的水平。视频四古典书房背景,沙发上戴着眼镜的小猫,站立在设计图纸上。
视频五漂浮在荒废都市中的水母,具备很强的科幻和超现实主义风格。
以上几段视频,再一次证明了 Sora 强大的视频生成能力。
如果 Sora 能够获得更高的算力支持,相信可以很快生成类似 Anvio、Angen 的超真实画面。此外,Sora 的技术报告中,也增加了一个简单的体验界面,切换标签就可以改变场景中的角色,生成新的视频。通过对标签的排列组合,可以生成 100 多段视频。大家可以尝试。
Sora的影响还继续扩大, 引发了各种衍生工具,并导致了很多项目的重组。
例如有开发者推出了一个名为 Sora Wi 的项目,只要接入 Sora 的 API,就可以直接生成视频,这是该项目地址:SoraWebui (SoraWebui) · GitHub。
该项目已经设计好了 UI 界面,并整合了 Strap 支付端口,只需简单的修改,就可以快速搭建一个基于 Sora 的套壳视频生成网站,或者适合手机端的应用程序。
随着 Sora 的发布,Pika也在近期开启了抢人计划。根据某科技媒体报道,皮卡挖走了lumiere项目的负责人。lumiere是 Google 最新的视频生成模型,也是最接近 Sora 的工具。如果能得到大量的资金支持和高级人才的加入,该项目则有机会获得更大的进展。
本周 Google 也有新动作,发布了一个名为Genie的视频生成工具: Genie: Generative Interactive Environments (google.com)。Genie 能够学习一致的动作空间,还能够模拟可变形物体。根据一张参考图生成可控制的游戏场景。
游戏开发者可以使用 Genie 完成游戏设计,或者结合文本转图像模型生成游戏人物并使用 Genie 为图像赋予交互性和可玩性。 此项技术的发布,意味着普通人也能够轻松设计简单的游戏场景。
领取专属 10元无门槛券
私享最新 技术干货