继ChatGPT之后,近日,美国OpenAI公司发布了首个视频生成模型“Sora”。您只要输入一段文本指令,就可以生成一段逼真的视频。
据介绍,此次发布的文字转视频模型可以依据用户输入的指令,生成一段时长可达1分钟的视频。
比如根据文本:“一位时尚女性走在东京街头,街道满是霓虹灯和城市标志。她穿着红色长裙、黑色皮夹克和黑色靴子,戴着太阳镜、涂着红色口红。”就可以生成这样的视频。
模型也能获取现有的静态图像并从中生成视频,还能获取现有视频,进行扩展或填充缺失内容。
当前,包括谷歌和Runway在内的多家公司,都在积极研发此类人工智能项目。
但OpenAI强调,“Sora”的突出之处在于其图像的真实感,以及能够生成比其他模型更长的视频片段。不过目前,“Sora”仍然存在缺陷,例如可能混淆一些文本指令中的空间细节,比如左右方向等。
然而,视频生成模型在推进人工智能技术发展的同时,也引发了人们对人工智能深度伪造视频可能加剧错误信息和虚假信息传播的担忧。
当地时间1月23日,2024年美国总统选举共和党党内初选在新罕布什尔州举行。在此之前,很多美国选民都表示,自己接到了一通“来自美国总统拜登的电话”。
但很快,白宫新闻秘书皮埃尔就澄清说,这是一则伪造的电话录音。
路透社报道截图
全球生成式人工智能技术发展迅猛,广泛应用于越来越多的行业中。中国科学院自动化研究所研究员、联合国人工智能高层顾问机构专家曾毅认为,现阶段生成式人工智能技术进步明显,但尚未真正理解人类物理世界,仍存在违反常识的错误,也使未来相关领域的监管面临挑战。
比如说“Sora”在连续的高精度的视频生成方面,它所采用的这个技术,使产生的人工智能造假的水平,可以说达到了一个前所未有的高度,给“眼见为实”带来了更大的挑战。
生成式人工智能技术发展,它的研发机构、企业要同步地发展和推广更高水平的自动化鉴伪技术。只有这样,生成式人工智能技术才能被更健康地研发和使用。
编辑丨杜慧琴 王洹星
签审丨闫明 江爱民
领取专属 10元无门槛券
私享最新 技术干货