前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样

Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样

作者头像
机器之心
发布于 2022-12-15 12:00:30
发布于 2022-12-15 12:00:30
1.2K0
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:杜伟、陈萍

修改一张图,一句话的事就搞定。

输入一句话,就能把图片修改好,这是很多画师梦寐以求的修图工具!但是话说回来,再优秀的画师,如果仅凭自己的专业优势,不借助其他工具,也很难在短时间内完成图片的修改。

现在好了,AI 正在向图片生成领域发起挑战,各大科技公司、高校等开始纷纷涉足。最近一段时间,关心 AI 圈的人可能都有这样一种感受:扩散模型被越来越多的人提及,基于扩散模型的各种图片生成工具被开发出来。

在众多模型中,Stable Diffusion 可谓是最出圈的一个,为其捐赠计算资源的英国开源人工智能公司 Stability AI 为此还获得了 1.01 亿美元融资,融资完成后,Stability AI 估值将达到 10 亿美元。就在最近,还闹出了 Stable Diffusion 背后团队互撕的笑话,原因是他们都想当 Stable Diffusion 的所有者。

其实这个模型的技术来源是发表在 CVPR 2022 中的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分别来自慕尼黑大学、海德堡大学和 AI 视频剪辑技术创业公司 Runway。

研究者对 Stable Diffusion 的开发一直在继续。就在今日,reddit 上一则帖子点赞量已经突破 800+。

大概意思就是:Stable Diffusion 背后团队之一的 Runway 公司发布了一个由 Stable Diffusion 模型驱动的图像擦除和替换(Erase and Replace)工具,该工具可以修改图像任何部分。用户需要做的就是擦除该区域并编写自然语言描述,剩下的交给程序就可以了。

举例来说,一开始树叶上是一只七星瓢虫,用户擦出掉(如紫色区域)该动物,然后输入自然语言描述「正在找食物的蜜蜂」,点击「替换」按钮就可以了。

土地里「长」出不同的植物:

站在柱子上的不同种类的鸟:

不同样式的林中小屋:

宇航员替换成卫星:

看完上述展示,不禁有种修改一张图,就一句话的事的感觉。

此外,Runway 还发布了「擦除和替换」功能背后的模型,感兴趣的小伙伴可以在 GitHub 上查看。该公司计划在未来推出更多 Stable Diffusion 检查点,并在 Runway 的 HPC 集群上进行训练。

GitHub 地址:https://github.com/runwayml/stable-diffusion#inpainting-with-stable-diffusion

项目首先通过 Huggingface 的 Diffusers 库来使用修复模型。Diffusers 是在 PyTorch 中用于图像和音频生成的 SOTA 扩散模型,并作为扩散模型推理和训练的模块化工具箱。

相关代码如下所示。

同时,为了评估修复模型的性能,项目使用了与论文《High-Resolution Image Synthesis with Latent Diffusion Models》中相同的评估协议。由于 Stable Diffusion 修复模型接受文本输入,因而只使用一个固定提示,即「photograph of a beautiful empty scene, highest quality settings.」。

评估结果如下所示。

网友大开脑洞,生成创意图片

这个「擦除和替换」工具大大激发了网友的创作兴趣,各种猎奇的创意作品都整出来了,让人不得不佩服脑洞之大。

有人使用它恶搞了前几天宣布辞职的英国前首相莉兹 · 特拉斯。

Twitter@aifunhouse

还有人对荷兰画家约翰内斯 · 维米尔的油画《戴珍珠耳环的少女》进行了一系列「改写」,有趣极了。

Twitter@Yining Shi

感兴趣的读者也可以试玩下:https://app.runwayml.com/login

参考链接:

https://github.com/huggingface/diffusers

https://80.lv/articles/runway-released-a-stable-diffusion-powered-tool-to-replace-images/

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
清华大学提出APDrawingGAN:人脸照片秒变艺术肖像画,已被CVPR 2019录取
肖像画作为人物画的一种,其简约的风格以及以形写神、迁想妙得的创作方法获得了大家的喜爱。
大数据文摘
2019/06/20
1.5K0
清华大学提出APDrawingGAN:人脸照片秒变艺术肖像画,已被CVPR 2019录取
四天搞懂生成对抗网络(四)——CycleGAN的绝妙设计:双向循环生成的结构
在“风格迁移四部曲系列”的《风格迁移的“精神始祖”Conditional GAN》文章中,已经跟大伙一起在MNIST手写数据集上手撸了CGAN,让GAN学会了“认标签,写数字”。然后,我们将CGAN“拟合条件概率分布”的思想发扬光大,在文章《用CGAN做图像转换的鼻祖pix2pix》中,让GAN学会了“看图学画风”,并用学会的图片风格渲染新图片。到这里GAN是不是已经有了点艺术家的气质了~
用户1386409
2020/11/23
19.3K0
四天搞懂生成对抗网络(四)——CycleGAN的绝妙设计:双向循环生成的结构
为什么说GANs是一个绝妙的艺术创作工具?
我是一个艺术家,同时也是一位开发者。艺术和软件在我的生活中曾经是两个平行的轨道,直到我发现了GANs(Generative Adversarial Networks):在一次偶然中,我尝试用Processing和计算摄影学来生成艺术,这将我所有的艺术作品都变成了模拟量。
大数据文摘
2018/10/18
7040
GAN应用汇总
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_25737169/article/details/80874717
DoubleV
2018/09/12
1.7K0
GAN应用汇总
人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN CVPR 2019 oral paper
该项工作被CVPR 2019录取为oral paper。CVPR是计算机视觉和人工智能领域内的国际顶级会议,2019共收到投稿5160篇,录取1300篇,其中oral paper288篇,仅占全部投稿的5.6%。
数据派THU
2019/06/18
1K0
人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN CVPR 2019 oral paper
头像神器!照片一键秒转简笔画,清华刘永进等CVPR 19 Oral研究 | 在线可玩
清华大学和英国卡迪夫大学的研究人员提出了一种名为APDrawingGAN系统,随意输入一张人脸照片,系统输出黑白人物线条画。
量子位
2019/06/17
7.3K0
头像神器!照片一键秒转简笔画,清华刘永进等CVPR 19 Oral研究 | 在线可玩
【技术综述】人脸风格化核心技术与数据集总结
人脸图像是计算机视觉领域中研究历史最久,也是应用最广泛的图像。近几年随着研究方法的进步以及相关数据集的收集,人脸风格化成为了一个非常热门的研究领域和应用方向,本文我们来介绍其中的核心技术和相关资源。
用户1508658
2020/07/01
1.2K0
【技术综述】人脸风格化核心技术与数据集总结
那个短命的一键“脱衣”软件,我在GitHub搜到了相关技术…
文章中蓝色字体为链接,部分外部链接无法从文章中直接跳转,请点击阅读原文以访问链接。
AiTechYun
2019/08/08
24.8K0
那个短命的一键“脱衣”软件,我在GitHub搜到了相关技术…
Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评
昨天,Stability AI宣布,Stable Diffusion 2.0版本上线!
新智元
2023/01/08
3.7K1
Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评
有哪些好用的头像生成器?这5个你一定喜欢
你是否经常因为找不到适合自己的头像而苦恼,有的时候工作号需要稍微专业的头像,而个人社交媒体账号头像比如抖音头像又想要搞怪有趣点,还有设计师需要一些默认的头像占位图,总之有各种不同的需求,今天神器集整理了5个最常用到的头像生成器工具,都是免费的,分享给大家。
LOGO设计小能手
2022/12/29
1.5K0
有哪些好用的头像生成器?这5个你一定喜欢
蒙娜丽莎.gif:三星新研究用一张图像合成动图,无需3D建模
他们生成的名人头部动画包括玛丽莲·梦露、爱因斯坦、蒙娜丽莎以及 Wu Tang Clan 的 RZA 等。
机器之心
2019/05/23
7180
Midjourney|文心一格 Prompt:完整参数列表、风格汇总、文生图词典合集
https://github.com/thinkingjimmy/Learning-Prompt
汀丶人工智能
2023/05/20
1.7K0
Midjourney|文心一格 Prompt:完整参数列表、风格汇总、文生图词典合集
CycleGAN论文的阅读与翻译,无监督风格迁移、对抗损失
CycleGAN tensorflow PyTorch by LynnHo,一个简单的 TensorFlow 实现
汀丶人工智能
2023/10/11
2K0
CycleGAN论文的阅读与翻译,无监督风格迁移、对抗损失
GAN“家族”又添新成员——EditGAN,不但能自己修图,还修得比你我都好
首先想让大家猜一猜,这四张图中你觉得哪张是P过的?小编先留个悬念不公布答案,请继续往下看。
AI科技评论
2021/11/23
6960
GAN“家族”又添新成员——EditGAN,不但能自己修图,还修得比你我都好
万圣节恐怖表演、内衣检测器......2019 年二十大有趣的机器学习项目盘点
作者 | Austin Kodra 编译 | 夕颜 出品 | AI科技大本营(ID:rgznai100)
AI算法与图像处理
2019/11/07
7580
万圣节恐怖表演、内衣检测器......2019 年二十大有趣的机器学习项目盘点
生成对抗网络项目:6~9
文本到图像的合成是生成对抗网络(GAN)的用例之一,它具有许多工业应用,就像前面章节中描述的 GAN 一样。 从文本描述中合成图像非常困难,因为要构建可以生成反映文本含义的图像的模型非常困难。 一个试图解决这个问题的网络是 StackGAN。 在本章中,我们将使用 TensorFlow 作为后端在 Keras 框架中实现 StackGAN。
ApacheCN_飞龙
2023/04/24
1.3K0
本季「必追」!16个社区热议工作及10篇国际AI顶会Best Papers一文回顾
2022 年一季度的尾声,在这个季度中,你是否担忧自己错过了哪些重要的技术工作?抑或想要检验下自己是不是在这一季度又有了哪些基础知识的增长? 本篇是机器之心「虎卷er行动 · 春卷er」的第一卷,旨在为老伙计们汇总并逐一盘点2022年开春以来机器之心编辑部报道发现的社区热议的技术工作,并回顾近期举办的国际AI顶会的最佳论文。 本卷资料收录 2022春季热议工作:16项 2022春季国际顶会最佳论文:10篇 2022 春季 · 机器之心报道社区热议工作 热议工作1:阿里达摩院语音实验室提出了一种具有线性
机器之心
2022/03/14
1.1K0
绝了!分割mask生成动漫人脸!爆肝数周,从零搭建
很多小伙伴期待已久的实战项目来了,今天分享一个国外论坛medium大佬的文章,从 0 做项目的整个过程,具有很大的参考价值,大家感兴趣的可以试着参考这个思路去实现,比起直接跑别人现有的完整,一定能更有收获和成就感。
AI算法与图像处理
2022/04/06
1.1K0
绝了!分割mask生成动漫人脸!爆肝数周,从零搭建
为什么说GAN很快就要替代现有摄影技术了?
许多人当听到“人工智能”、“机器学习”或者“bot”的时候,首先浮现在脑海当中的应当是科幻片中经常出现、未来感十足的既会走路又会说话的机器人。
新智元
2019/05/08
9110
为什么说GAN很快就要替代现有摄影技术了?
【AI白身境】一文览尽计算机视觉研究方向
图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务,从最开始比较简单的10分类的灰度图像手写数字识别mnist,到后来更大一点的10分类的cifar10和100分类的cifar100,到后来的imagenet,图像分类任务伴随着数据库的增长,一步一步提升到了今天的水平。
用户1508658
2019/07/26
8350
【AI白身境】一文览尽计算机视觉研究方向
推荐阅读
清华大学提出APDrawingGAN:人脸照片秒变艺术肖像画,已被CVPR 2019录取
1.5K0
四天搞懂生成对抗网络(四)——CycleGAN的绝妙设计:双向循环生成的结构
19.3K0
为什么说GANs是一个绝妙的艺术创作工具?
7040
GAN应用汇总
1.7K0
人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN CVPR 2019 oral paper
1K0
头像神器!照片一键秒转简笔画,清华刘永进等CVPR 19 Oral研究 | 在线可玩
7.3K0
【技术综述】人脸风格化核心技术与数据集总结
1.2K0
那个短命的一键“脱衣”软件,我在GitHub搜到了相关技术…
24.8K0
Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评
3.7K1
有哪些好用的头像生成器?这5个你一定喜欢
1.5K0
蒙娜丽莎.gif:三星新研究用一张图像合成动图,无需3D建模
7180
Midjourney|文心一格 Prompt:完整参数列表、风格汇总、文生图词典合集
1.7K0
CycleGAN论文的阅读与翻译,无监督风格迁移、对抗损失
2K0
GAN“家族”又添新成员——EditGAN,不但能自己修图,还修得比你我都好
6960
万圣节恐怖表演、内衣检测器......2019 年二十大有趣的机器学习项目盘点
7580
生成对抗网络项目:6~9
1.3K0
本季「必追」!16个社区热议工作及10篇国际AI顶会Best Papers一文回顾
1.1K0
绝了!分割mask生成动漫人脸!爆肝数周,从零搭建
1.1K0
为什么说GAN很快就要替代现有摄影技术了?
9110
【AI白身境】一文览尽计算机视觉研究方向
8350
相关推荐
清华大学提出APDrawingGAN:人脸照片秒变艺术肖像画,已被CVPR 2019录取
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档