OpenAI在其文本到图像的AI模型DALL-E中增加了一个新的“外画”功能,可以让系统扩展任何给定图片的边界,生成新的视觉效果。
在视频中,你可以看到DALL-E是如何在人类提示的帮助下,“想象”约翰内斯·维米尔(JohannesVermeer)的肖像画《戴珍珠耳环的女孩》框架之外的东西。请注意,即使从画像提供的有限信息中,该系统也能够模仿原作的阴影和亮点,匹配维米尔的风格。
绝对值得强调的是,系统并不是自己生成这些扩展。与所有文本到图像的人工智能一样,该模型要求人类描述新的视觉效果。
从更广泛的角度来看,外画并不能真正扩展文本到图像的AI系统的基本功能,但它确实展示了OpenAI努力将可用性作为客户的关键卖点。例如,对于一个画家或者设计师来说,他可以将自己未完成的作品输入,通过人工智能去完成最终的完整作品。
许多文本到图像的AI模型可以执行与外画相同的基本功能,但是需要相当多的人工操作。尽可能简单地进行绘画将帮助DALL-E区别于其他竞争对手。
DALL-E现在可以通过beta程序使用,目前有超过100万用户可以访问。每个beta用户在第一个月获得50次免费图片生成,之后每个月获得15次额外使用。他们也可以花15美元购买115个额外的图像生成次数。
领取专属 10元无门槛券
私享最新 技术干货