首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

以后的图库素材库会被AI取代?DALL-E2刚发不久又被Imagen赶上

说起DALL-E2的大名,想必很多关注人工智能科技行业的小伙伴们都了解。可以说,文本生成图像这个堪比考验人工智能想象力的技术至高点,被OpenAI的DALL-E2发挥得淋漓尽致。DALL-E2的这一AI想象力震惊全网,刚过月吧,就有挑战者卷土而来。

这个挑战者就是Google谷歌派出的名为Imagen的AI选手。文本生成图像更逼真,表现出了更卓越的能力。为了凸显它的高超能力,分析者做了几个对照实验,以同样的文本分别提供给DALL-E2和Imagen让它们“想象”并画出来。机智客看到网上结果显示,Imagen更符合描述要求,有更高的真实性。另外实验有一点发现了,DALL·E 2难以准确理解同时出现两个颜色要求的情况,而Imagen就没问题。更详细的信息这里就不罗列了,有兴趣的朋友可以自行查找。

从技术上说,此次谷歌的Imagen抛弃了从文本特征映射到图像特征再用GAN或扩散模型生成图像的常规思路,而是使用纯语言模型只负责编码文本特征,把文本到图像转换的工作丢给了图像生成模型。当然了,这里的图像生成模型,依然是扩散模型,是一系列的扩散模型。这就意味着其纯文本数据获取方面和全面性方面比获取图文对数据容易,其文本理解能力上比图文对数据的理解能力强。

而且,谷歌Imagen此次优秀的表现还是在并不大(相对而言)的训练数据规模上,如果扩大一下规模,会更好吗?实验中谷歌发现的确如此,扩大语言模型的规模对最后效果影响更大,超过扩大图像生成模型的影响。当然了,机智客看资料后感觉,尽管Imagen表现卓越,几乎完美,在理解方面很多情况下表现都强于DALL-E2,不过它还是有缺点,正常情况下,我们提的画面很绕口,AI也能画出来。不过当我们剑走偏锋,提一个反常识的画,比如正常情况下是人骑马,而我们偏偏让AI画马骑人,这样这俩AI就歇火了。

由此看来,目前的人工智能再强,它们还是不理解实质的含义,那么我们人类是不是就可以放一丢丢心了?当然了,即便如此,这款新出的AI也已经够惊世骇俗的了。不用说,大家这刚从OpenAI的DALL-E2的震惊中走出来,又遭遇更震撼“暴击”。看得一众读者目瞪口呆,一时间惊呼不断,感叹科技进步之快,难怪有人表示,以后的图库是不是就会被人工智能取代了?

先取代设计师的图库素材库,再取代设计师,如果AI按这个步骤来,那么我们岂不是更不敢放心用AI的图库素材?哈哈,开个玩笑,结束文章。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220526A02CJU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券