首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >原画师惊呆:这个爆火AI真把梦境画成现实了!下载APP人人可用

原画师惊呆:这个爆火AI真把梦境画成现实了!下载APP人人可用

作者头像
量子位
发布于 2022-04-28 03:11:50
发布于 2022-04-28 03:11:50
1.2K0
举报
文章被收录于专栏:量子位量子位
明敏 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI

没想到,平常都是我拿着最新AI的Demo到处去安利。

这回竟然被美术圈的朋友安利了一个AI绘画APP???

话不多说先看效果:

这摩登又玄幻的画面,一上来就冲击到我了。

抽象的线条兼具了美感和想象力,同时还传递出未来城市的感觉。

要不是被剧透,我还真不一定能立刻猜出来这是出自AI之手。

而且除了能对照片进行二改,这个AI还能根据文字命题、凭自己想象作画。

比如输入落日飞车四个字,在AI的“想象”中会是这样:

另外还可以画出不同画风,目前已支持20种。

还真是能满足你提出的所有需求,怪不得能征服美术设计圈(doge)。

AI画完后,甚至可以一键保存成手机壁纸。

在微信公众号后台回复“wombo”,可开盲盒获得随机壁纸,总共5款哦~

过去几天,这款APP还在Apple Store图形和设计区霸榜多日(安卓版本也有)。

要知道,过去美术圈、艺术圈可是有不少人吐槽AI生成的内容没得灵魂。。。

结果现在纷纷在社交平台上po自己的作品,还有设计区大V要专门聊聊这个事儿。

但更让我震惊的是,这个APP背后公司的故事。

公司创始人现在只有25岁,为了创业,他直接从多伦多大学退学。

公司首次推出的APP(WOMBO.AI),能让照片对口型唱歌。

‍‍没错,就是那个此前在抖音上爆火、席卷全球互联网的魔性特效。

凭借着这款APP,这家公司估值直冲4000万美元(折合人民币约2.5亿)。

而他们最初的启动资金,只有6万美元。

这不禁让人好奇,到底是怎样的一伙人,能凭借AI一次又一次做出全球爆火的APP?

25岁辍学创业,公司估值4000万美元

先从小哥的公司Wombo创办说起。

Wombo是一家加拿大公司,创始人及CEO名叫Ben-Zion Benkhin,今年25岁。

(接下来我们暂时用“小本哥”来称呼他)

小本哥本来是多伦多大学数学与哲学专业的一位学生。

在学校的时候,他组建过一个人工智能兴趣社团,自己对deepfake也十分感兴趣。

2020年8月的一个夏夜,小本哥和他的室友在公寓屋顶上吹风,突然灵光一现:

为什么没有人做一个APP,可以把一张普通的照片变成搞笑视频?

Wombo效果

在经过4个小时的讨论之后,Wombo的雏形轮廓逐渐清晰了起来。

虽然当时吹风的时候小本哥还顺带飞了点叶子(doge),但是他对这个想法还真不是一时上头。

为此,他选择辍学完成创业。

同时还拉来了自己做管理顾问的朋友Paul Pavel一起“搞‍事”,并在多伦多大学招募了一些学生。

‍其中Angad Arneja放弃了全额奖学金,选择和小本哥一样辍学,现在他是Wombo的人力主管。

公司最初启动资金有6万美元,主要依靠各位创始人的父母慷慨解囊。

小本哥说这些钱主要用在了买电脑、招募开发人员和品牌推广上。

大约半年以后,2021年2月28日,Wombo就准备好发布了。

小本哥和其他公司创始人们把这个应用发给了大约10个人。

一周之内,Wombo的下载量就达到了50万次

第二周,这个数字跃升到了900万

由此,Wombo也引起了各方投资人的关注,顺利拿到了由Global Founders Capital和Sofreh Capital共同领投600万美元天使轮。

现在估值达到了4000万美元。

值得一提的是,Wombo在爆火前,曾被200多家VC拒绝过。

所以这一波下来,真正赢麻了的是最初提供启动资金的家长们。

比如Paul Pavel的父母就是资助2万美元,最终换来了数十万美元的股票。

目前,Wombo旗下的两个APP下载量已经达到了8400万+,月活用户超过1000万。

Wombo上的创作量已经达到10亿,Dream by Wombo这一数据也达到了1.8亿

由此带来的收入也非常可观,去年Wombo上线4个多月,依靠内部广告和免费歌曲库获得了数十万美元的收入。

Dream by Wombo支持用户购买自己用AI生成的作品。

20美元可定制一张海报,加边框的价格则从45美元起算。

这个AI是怎么画画的?

让AI根据文字作画,了解AI的朋友会知道这属于多模态生成

模态,指的是文本、图像、声音等不同的信息表现形式。

多模态,则是把不同类型的信息结合起来。

如果给每个图片标上文字描述组成一对,用大量这种图文对去训练AI,就能让它理解到图文之间的对应关系。

OpenAI开源的CLIP就是这个原理,Wombo工程师也曾在一次采访中透露过,他们的算法中就使用了CLIP。

CLIP使用了4亿组从网上收集的图文对做训练,可以理解颜色和形状,日常物品或建筑物,甚至抽象的艺术风格比如“印象派”或“赛博朋克”。

CLIP训练数据示例

接下来,还要解决图像生成的部分。

没错,又要请出GAN了,而且这次GAN要接受CLIP的指挥。

整个流程是这样的:

首先生成一张平平无奇的随机图像当种子。

让CLIP给图像与文字描述的相似度打分,反馈给GAN,GAN以提升分数为目标不断迭代。

整个迭代过程可以在App中直观地看到。

其中的随机性意味着AI几乎不可能两次生成同样的图像。

如果第一次结果不满意,还可以点击按钮用相同配置再试一次。

至于Wombo的算法具体使用了哪种GAN,并未公开。

但在招聘信息里,高级机器学习工程师的岗位描述中写着,有DC-GAN经验的优先。

DC-GAN最早于2015年提出,是第一个使用深度卷积网络生成图像的GAN变体。

意味着Wombo的算法大概率是以此为基础改进而来。

Wombo选择卷积网络而不是Transformer的理由也不难猜。

要做成移动App给全球玩家使用,而且生成的是高分辨率图像,卷积在效率上要占优势。

CLIP+GAN结合成AI画家的方法并非Wombo首创。

CLIP于2021年1月发布,第二天网友@advadnoun就开始试验其与各种生成模型的组合。

最终他选择了BigGAN,将代码发布为Colab笔记The Big Sleep

早期The Big Sleep生成的画,怎么说呢,总是带点精神污染,分辨率也不高。

(建议不要去翻@advadnoun的早期分享,真的有毒)

后来西班牙玩家Katherine Crowson在此基础上发布了CLIP+VQGAN的版本。

VQGAN是CVPR 2021 Oral入选论文,将CNN的高效率和Transformer的高性能结合起来,生成的图像质量更高。

这一版Colab笔记真正流行了起来,不少人开始分享AI创作的画,还开发出各种技巧。

比如文字提示中加入虚幻引擎或者光线追踪,画质还能大幅提升。

围绕CLIP+VQGAN开始形成社区,代码不断有人做优化改进,还有了专门收集发布AI画作的账号。

而最早的先驱@advadnoun还顺利入职Adobe担任研究员。

但这一波AI作画浪潮的玩家主要还是技术爱好者。

毕竟在Colab上排队申请GPU、运行代码训练AI,时不时还要处理一下报错,门槛还是有点高了。

直到Dream by WOMBO的出现,改变了一切。

AI作画开始被认真对待

实际上,这几年已经浮现出不少让AI作画的技术工具。

最早是谷歌在2015年推出的DeepDream。

后来,除了前面提到的以外,还有英伟达的GauGAN、OpenAI的DALL·E,开源的Disco Diffusion等。

凭借着独一无二还惊艳众人的特点,AI作画影响到的圈层也越来越广泛,比较典型的有美术圈、艺术收藏圈以及NFT领域。

首先来看美术圈,他们接触更多的是Disco Diffusion。

这款AI用扩散模型代替了GAN,生成图像的质量更高,几乎达到了原画级。

尽管要在Colab上自己运行代码,门槛不低,但还是大受欢迎,甚至出现了专门收集提示词的共享文档。

知乎上最近也有一个与之相关的热门话题。

AI绘画会对美术行业产生什么样的影响呢?

在这个讨论中,大部分人都觉得,AI对当下美术圈的影响还比较有限

但是未来呢?大家的观点不尽相同。

有人认为AI可以成为创作者的辅助工具;有人却觉得AI能直接取代画师。

知乎答主@画画的花噎菜认为,AI绘画依旧淘汰不了绘画行业。

往远了说,照相机没有淘汰写实油画;往近了说3D辅助也没有淘汰写实数绘。 …… 如果你还是怕被抢了饭碗,那不妨让自己画得好一点。因为不论什么行业,高端的市场都是最难被淘汰的。

@鱼一般也觉得,AI将会是专业画师手中一个很好的工具,可以提供很多灵感,也可以当做底稿使用。

@Liuuzaki虽然也赞同AI在想象力上是长板,但他认为,AI有一天会取代与之工作方式相似的从业者。

AI并不擅长逻辑,只擅长美感。它是天生的艺术家,而不是工程师。 这种工作方式很像现在的一些美术工作者。

而如果再把目光延伸到艺术收藏圈来看,AI作画在这几年已经带来了一些肉眼可见的影响。

2018年,一幅由AI创作出的肖像画在纽约佳士得拍卖会上以43.2万美元成交。

这一价格也是该场拍卖会的最高成交价,甚至超过了同场拍卖的毕加索作品。

这幅画最大的噱头,便是用GAN作画所带来的的独一无二性

One More Thing

最后,AI作画还影响到了同样在冲击艺术圈的NFT

此前有人推出了一个平台Eponym。

它能够利用AI将文本转化为图画,然后再将这些作品直接铸造到最大的NFT市场OpenSea。

在这个平台上,每个文本只能生成一幅画作。

由它推出第一批NFT(3500个),在OpenSea上一夜售罄。

Eponym生成的作品

关于AI作画将成为NFT领域的下一个趋势,也成为最近圈内热议的话题。

实际上,Wombo也有进军NFT领域的打算。

去年年底,有位网友在推特上向他们发问:

你们是否把用户生成的画作铸造成了NFT?

对此官方给出回应:目前还没有铸造,但是正在考虑这一计划!

这事儿,你怎么看呢?

(别忘了在微信公众号后台回复“wombo”,可开盲盒获得随机壁纸~)

AI绘图灵感共享库: https://docs.qq.com/sheet/DWFR0VmpQa3ZtbXda

TheBigSleep: https://colab.research.google.com/drive/1NCceX2mbiKOSlAd_o7IU7nA9UskKN5WR

CLIP+VQGAN: https://ljvmiranda921.github.io/notebook/2021/08/11/vqgan-list/

Disco Diffusion: https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

参考链接: [1]https://www.theglobeandmail.com/business/article-making-it-by-faking-it-how-torontos-wombo-became-canadas-fastest/ [2]https://www.8btc.com/article/6722724 [3]https://artthescience.com/magazine/2022/02/16/features-wombo-dream-and-ai-art-with-salman-shahid/ [4]https://weibo.com/u/5619550614?is_hot=1 [5]https://www.zhihu.com/question/528563685/answer/2447959396 [6]https://www.zhihu.com/question/528563685/answer/2445286621 [7]https://www.zhihu.com/question/528563685/answer/2445279372

「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入我们,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
柯洁预言AI绘画会替代大部分画师,网友:初代AI受害者现身说法
在各种Diffusion模型掀起一波又一波AI作画舆论高潮的当下,世界围棋冠军柯洁如是说。
量子位
2022/12/08
4980
柯洁预言AI绘画会替代大部分画师,网友:初代AI受害者现身说法
AI 作画初体验
连续看了几期和菜头的公众号上关于 AI 作画的文章后,我也产生了一些兴趣。作为一名理科生,立马就行动起来,这篇文章就聊一聊我的尝试过程。
云水木石
2022/08/30
1.2K0
AI 作画初体验
我给梵高当Tony:这三款AI绘图工具,就离谱
大数据文摘授权转载自果壳 作者:Simon_阿文 编辑:biu 很多人说今年是“AI 绘画元年”。先是 Disco Diffusion 火出了圈,从 Text-to-Image(用文字生成图像)开发社区和创意设计行业,火到了普通人的视野中。 人们热衷将两种完全不搭界的对象,比如“达芬奇”和“iPhone”字样,输入 AI 程序,然后等着画面层层渲染完成。 又比如,我就把荷包蛋揉进了云朵里丨作者用 Disco Diffusion 生成 那是一种“拆盲盒”般的体验。对于没有任何美术基础和绘画能力的人来说,AI
大数据文摘
2022/06/20
9760
我给梵高当Tony:这三款AI绘图工具,就离谱
分享15个全球顶尖的AIGC图片生成平台
人工智能正在改变许多行业的格局,而其中改变最直观和影响最大的就是AIGC领域的图像创作。
非喵鱼
2022/12/31
33.3K0
分享15个全球顶尖的AIGC图片生成平台
Hinton上榜!盘点AI图像合成10年史,那些值得被记住的论文和名字
深度学习模型在生成图像上的表现,已经如此出色。很显然,它在未来会给我们更多的惊喜。
新智元
2023/01/08
4650
Hinton上榜!盘点AI图像合成10年史,那些值得被记住的论文和名字
今年很火的AI绘画怎么玩
2022年绝对可以说是AIGC元年,从google搜索的趋势来看,在2022年AI绘画及AI生成艺术的搜索量激增。
得物技术
2023/03/22
1.5K0
今年很火的AI绘画怎么玩
AI 创作离我们还远吗?
导语|近些年AI蓬勃发展,在各行各业都有着不同方式的应用。而AI创作艺术和生产内容无疑是今年以来最热门的话题,MidJourney生成的画作拿到艺术比赛第一名以及Stable Diffusion的开源,无疑将文本生成图片的热点在近期推向了高潮。那么AI创作到底发生过什么,原理又是如何,是噱头还是会有对我们有用的潜在应用场景呢?我们尝试深入浅出地来回答这些问题。 本文作者:ryanlyin,腾讯IEG数据科学 一、 AI创作怎么火了? 今年开始,文本描述自动生成图片(Text-to-Image)的AI绘画黑科
腾讯大讲堂
2022/11/03
1.4K0
AI 创作离我们还远吗?
使用GPU云服务器实现AI绘画
AI绘画是近期比较热门的一个应用,其功能主要为可以把用户输入的一段或几段文字,使用训练好的模型来自动生成一幅美丽的画作。
爱去西
2022/05/24
22.7K7
使用GPU云服务器实现AI绘画
AI绘画火了!一文看懂背后技术原理
点个关注👆跟腾讯工程师学技术 导语 | 近些年AI蓬勃发展,在各行各业都有着不同方式的应用。而AI创作艺术和生产内容无疑是今年以来最热门的话题,AI创作到底发生过什么,原理又是如何,是噱头还是会有对我们有用的潜在应用场景呢?我们旨在深入浅出的尝试回答这些问题。 AI创作怎么火了? 今年开始,文本描述自动生成图片(Text-to-Image)的AI绘画黑科技一下子变火了。很多人对AI绘画产生巨大兴趣是从一副AI作品的新闻开始的。这幅由MidJourney生成的数字油画参加了Colorado博览会的艺术比
腾讯云开发者
2022/11/02
2.1K0
AI绘画火了!一文看懂背后技术原理
B站大谷新作:10天用AI画了一首爱情MV!瑰丽玄妙,宛如梦境
---- 新智元报道   编辑:桃子 拉燕 【新智元导读】耗时10天,B站up主大谷带着他的新作又来了!这次,他用AI「画」了一首音乐MV,配上动感音乐,简直太魔幻了。 B站up主大谷最近又整了一个新活儿: 用AI「画」了一首音乐MV。 不如先看个视频,体验下这场视觉和听觉的盛宴。 怎么样,是不是整体很动感魔幻? 瑰丽玄妙,宛如梦境 据大谷介绍,这个视频自己耗时10天才完工。 这期间,大谷全程负责「监工」,盯着AI干活,并提供给AI需要的摄像机镜头位移坐标,补充一点场景文字信息。 到后期再填上字
新智元
2022/06/27
6030
B站大谷新作:10天用AI画了一首爱情MV!瑰丽玄妙,宛如梦境
300万成交!佳士得刚刚拍卖出首款AI画作,同场碾压毕加索
我叫Edmond de Belamy,是这个星球上第一幅参加艺术品拍卖的AI画作。
量子位
2018/12/04
7270
300万成交!佳士得刚刚拍卖出首款AI画作,同场碾压毕加索
AI 作画第二弹
上次一次尝试 AI 作画,还是在 6 月份,详情可见 《AI 作画初体验》。那个时候使用的是 Google 开发的 DD (Disco Diffusion) 系统,使用的版本为 V5.0。DD 作画的确令人惊艳,但没想到,不到两个月的时间,SD (Stable Diffusion) 斜里杀出,一下子抢了 DD 的风头。之前研究 DD 作画入魔的和菜头,也转头倒向了 SD。下面是他的作品:
云水木石
2022/12/01
1.1K0
AI 作画第二弹
国产AI绘画海克斯科技——爱作画AIGC开放平台
去年年底,CLIP模型 和 Diffusion模型 的完美结合,很好地跨过了AI绘画的技术门槛,让AI绘画效果实现质的飞跃,直接达到可商业落地的效果,这一重大技术突破也让AI绘图火出了圈。
火星情报局
2022/11/02
1.6K0
2022年全网最全AI绘画产品整理(一共23款,免费的绘画次数用到你手软)
完全够普通人到日常绘画需求;如果你有大量的绘画需求(月绘画次数过万),欢迎联系(关注公众号:飞链云3D数字生态),提供专门的开放平台API接口对接,基于我们研发能力和算法的提升,我们价格可低至6分一次(市场价格通常在1毛-2毛不等);专业阿里系研发团队,日承载绘画次数可达百万次;
谙忆
2023/01/30
3.7K0
2023年最新AIGC绘画水平发展
作者:yiqiuzheng,腾讯 IEG 前端工程师 一、现状 这两年 AI 关键词频频热搜,从 2022 年 4 月初代码自动补全神器Copilot点燃程序员圈,到 10 月中旬的 AI 绘画Stable Diffcusion 1.0震惊绘画圈,最后到如今的ChatGPT引爆全网各领域。AI 人工智能时代已然到来。在 2023 年,AI 绘画技术和应用的发展已经非常迅速。目前,AI 绘画技术已经能够生成逼真的图像、视频和音频,同时还能够模仿艺术家的风格,创造出令人惊叹的艺术作品。 但是这些早期的 AI 绘
腾讯技术工程官方号
2023/04/01
1.5K0
2023年最新AIGC绘画水平发展
什么是生成艺术NFT,Art Blocks为什么能持续霸榜
9月2日 Opensae 最近交易数据显示,Art Blocks 截至目前的总交易额已突破 233849 Eth 约 8.6 亿美元 ,创下历史新高,交易者数量突破2万。8月27日,Art Blocks 铸造的艺术品 Ringer #879以 568.5 万美元(1.8K ETH)价格成交,是历史上交易额第三高的 NFT 收藏品。
xiangzhihong
2021/12/30
9840
什么是生成艺术NFT,Art Blocks为什么能持续霸榜
当设计遇上AI
一、背景 最近AI创作内容火爆网络,让我们看到AI在设计上充满想象力的未来。关于AI在设计上应用的探索由来已久,从早几年的智能广告素材,智能Logo再到如今的AIGC,AI的成长突飞猛进。本文尝试梳理AI目前在设计领域应用的最新进展,展望设计行业在AI技术影响下可能发生的变革。 二、AI与设计相关的最新技术 1、自动化内容生成(AIGC) 从文本-图像、文本-视频、文本-3D模型到智能字体、智能文本,AI在各类内容的创造上已经突飞猛进,强大到让人惊叹地步。 1.1 文本-图像技术 近一两年以来,各大平台推出
腾讯ISUX
2023/04/14
1K0
当设计遇上AI
我一个插画师给AI打下手,月入3千
杨净 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI AI生成厉害到什么程度?现在人类已经在为它打下手了。 据一位画手网友分享,他们圈子里已经诞生了全新的工种! 虽然乍一看名字别无二致都是“插画师”,但细看工作内容:使用AI绘画然后筛选精修。救,这不妥妥就是跟着AI干些边角料的活儿嘛~ 换言之,你压根就不需要有绘画能力,只要会PS就能胜任这个岗位。 于是就有网友吐槽:工作没前景量还大,老板真是紧跟时代。 再加上修补工作十分复杂,也不是寻常人所能干的,而公司只给了3-4千的薪资水平(兼职)。 不
量子位
2022/10/10
8240
我一个插画师给AI打下手,月入3千
这个AI批量作画每小时九张,与毕加索同台竞技,还真有人买
在那次拍卖会上,一共有363件画作“同台竞技”,其中包括20多幅毕加索的名画。最终一幅“特别”的画作力压群雄,以43.25万美元(约300万人民币)成交,值得注意的是这也是全场的最高价格。
大数据文摘
2019/06/04
1.5K0
这个AI批量作画每小时九张,与毕加索同台竞技,还真有人买
10年研究积累,推动图像合成进入「PS」时代
选自zentralwerkstatt.org 作者:Fabian offer 机器之心编译 编辑:袁铭怿 今年大火的图像合成方向已走过十年。 2022 年已经接近尾声。深度学习模型在生成图像方面的表现愈发出色,显然,未来该模型还将继续发展。今天的局面是如何一步步发展而来的呢?这得追溯到十年前,也就是当今所说的 “AI 之夏” 的起源。下文以时间轴的形式追溯了一些里程碑,从论文、架构、模型、数据集到实验。 Hacker News 评论中有人指出,Hinton 等人的深度信念网早在 2006 年就被用于生成合
机器之心
2023/03/29
4310
10年研究积累,推动图像合成进入「PS」时代
推荐阅读
相关推荐
柯洁预言AI绘画会替代大部分画师,网友:初代AI受害者现身说法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档