首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI发布让人震撼的文生视频模型Sora,或将引领影视创作新潮流

OpenAI最新发布一款名为Sora的文生视频模型,能够创作出电影级的视频,且最长可达一分钟。这一技术的推出,无疑给影视制作领域带来了巨大的震撼和启示。

​(Sora生成的演示视频截图)

一直以来,人工智能在语言理解和推理方面展现出了强大的能力。OpenAI的聊天机器人ChatGPT便是一个很好的例子,它能够顺利通过律师考试,证明了AI在语言处理方面的高超技艺。而现在,Sora的出现,则进一步展示了AI在创意和艺术领域的潜力。

相较于其他模型,Sora能够生成更长的视频片段,最长可达一分钟。这意味着Sora具备更高的创作能力和持续性,能够生成更为完整及连贯的视频内容。尽管在视频中仍存在一些微小的瑕疵,但这并不影响它展现出在虚拟世界建设方面的巨大潜力。

从演示视频来看,Sora所创造出的视频图像真实感十足,仿佛将观众置身于现实场景中。这种能力为电影制作提供了新的可能性和创作灵感。然而,专业的影视制作设计师们可能会对Sora是否将成为一个强大的合作伙伴展开讨论。虽然Sora能够生成视频,但其中的人物或缺乏特写镜头及情感表达,这或许限制了Sora在电影创作中的应用。但对于大众用户的创作来说,Sora生成的视频已经足够让人感到惊艳。

Sora的出现确实为电影创作提供了新的可能性及创作灵感,也为行业带来了新的发展机遇。目前,Sora作为研究产品,OpenAI将首先面向少数精心挑选的创作者进行内测。OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

Sora的工作原理是,作为一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声。视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,具有极强的扩展性。视频和图像是由被称为“补丁”的较小数据单位集合而成,每个“补丁”都类似于GPT中的一个标记(Token)。通过统一的数据表达方式,Sora可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。

Sora是基于过去对DALL·E和GPT的研究基础构建而成。它利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好地遵循文本指令。这一技术的应用使得Sora在视频创作方面展现出了卓越的能力。

总体来讲,OpenAI新发布的文生视频模型Sora真实展示了人工智能在电影创作领域的巨大潜力。虽然关于Sora是否能成为影视制作设计师的强大合作伙伴还需进一步讨论,但Sora的出现无疑为电影创作提供了新的可能性及创作灵感。随着技术的不断发展和完善我们有理由相信Sora将为电影制作领域带来更多的惊喜和突破。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OPuZX1BqoDsuQjqCeTY2Bs4Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券