Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >AIGC:DALL·E 2、Midjourney和 Stable Diffusion 产品对比

AIGC:DALL·E 2、Midjourney和 Stable Diffusion 产品对比

作者头像
Freedom123
发布于 2024-03-29 07:43:28
发布于 2024-03-29 07:43:28
1.3K0
举报
文章被收录于专栏:DevOpsDevOps

前言

随着 Diffusion Model 的普及,大家可能注意到互联网上有着铺天盖地的人工智能 (AI) 生成的图像,这些图像都是使用『文本到图像』的生成模型生成的:只需要输入一个文本描述(prompt/提示),AI 模型就可以在几秒几分钟内生成一个或多个精准匹配提示的精美图像。截止目前为止,三个最流行的AI作画产品是 📘Stable Diffusion、📘Midjourney和 📘DALL·E 2。

在本文中,ShowMeAI将对这3种模型进行比较,我们不会介绍这些 AI 模型后面的复杂数学原理,而聚焦在使用方法和效果对比。

一、DALL·E2

DALL·E2由 📘OpenAI开发,目前产品版本处于 beta 阶段。

1.如何使用

① 文本提示作图 在 DALL·E2 中,可以使用 『文本到图像』和『文本引导的图像到图像』生成算法生成图像。 使用『文本引导的图像到图像』生成算法,您可以上传图像,AI会以你上传的图像为初始图,根据提示来作图。

上图 DALL·E 作画提示词:A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画)。

② 文本提示的图到图 它还有『编辑生成的图像』功能,使用『文本引导图像到图像』生成算法,我们可以在已生成的图像之上生成另一个图像来扩展生成的图像,或者对有遮蔽的图像进行补全创作。

③ 分辨率和格式 在 DALL·E2 中,所有生成的图像都具有 1024 x 1024 的固定图像大小 。

2.使用注意事项

首次访问 DALL·E 可以获得 50 个免✦费积分(要求在第一个月内用完)。 在接下来的每个月中,都会获得 15 个免✦费积分(对,同样的道理,免✦费积分不会累加)。每1个提示默认会创建4个图像,消耗大约1个积分,你也可以付费花 15 美元购买 115 次作图。

DALL·E2 生成的图像可以用于任何合法目的,包括商✦业用途。

二、Midjourney

📘Midjourney 由同名研究实验室开发,目前处于公测阶段。

1.如何使用

生成图像 Midjourney ,您可以使用 📘Midjourney Discord 服务器。

① 文本提示作图 Midjourney的『文本提示做图』也非常简单,也同样是提交提示文本,就可以生成对应的结果。

上面的截图,是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

② 图像变体&高分辨率 此外,您可以创建生成图像的其他变体或将生成的图像放大到更高分辨率。

我们也可以输入一个或多个图像的 URL,以其作为初始,配以提示文本引导作图。

③ 分辨率和格式 Midjourney支持创建各种格式的图像,图像分辨率高达 2048 x 2048 。

2.使用注意事项

首次加入 Midjourney Discord 服务器,我们可以获得 25 分钟的免✦费 GPU 时间,大致可以支撑 25 次免✦费生成(1次生成大概需要1 GPU 分钟)。单次请求将根据提示生成4个候选画作。

Midjourney允许付费会员将 Midjourney 生成的图像用于商✦业用途。

三、Stable Diffusion

Stable Diffusion 由 📘CompVis、 📘Stability AI和 📘LAION开源,于 2022 年 8 月发布,大家都可以使用(但需要一些服务器计算资源支撑)。

1.如何使用

如果要本地运行 Stable Diffusion,至少需要 10GB VRAM 的 GPU。 Huggingface 提供了有关如何使用 📘Stable Diffusion 教程。如果您不想编写和触碰任何代码,也可以使用 📘Dream Studio Web 应用程序,只需要注册一个帐户即可。

① 文本提示做图 Dream Studio 提供 『文本到图像』,它具有各种选项,例如设置生成图像的步骤数或设置随机种子,可以设置单次生成的图像数量(1 到 9 之间)。

上图为 Dream Studio 提示词 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

一个快捷尝试的方式是在 📘HuggingFace的 📘Diffuse the Rest应用里尝试,如下图所示:

② 分辨率和格式 使用 Stable Diffusion,您可以创建各种格式的图像,图像分辨率高达 1024 x 1024。

2.使用注意事项

首次注册 DreamStudio beta 将获得价值 2 英镑的积分。 这大约相当于 200 次单张图免✦费生成的额度。 免✦费试用后可以按 10 英镑的增量购买额外的积分。

随意使用来自 DreamStudio Beta 和 Stable Diffusion beta Discord 服务的图像用于任何用途, 包括商✦业目的 。

总结

在本文中,我们比较了目前最流行的3个图像生成平台 DALL·E2、Midjourney、Stable Diffusion。对比的结果汇总如下表:不过请大家注意,下表可能会发生变化,因为这三个模型正在积极开发中,功能也在不断完善。下方的信息来源时间点为2022年9月。

参考资料 📘 你给文字描述, AI 艺术作画,精美无比!附源码,快来试试!:https://www.showmeai.tech/article-detail/313 📘 使用Hugging Face发布的diffuser模型快速绘画:https://www.showmeai.tech/article-detail/312 📘 DALL·E2:https://openai.com/dall-e-2/ 📘 OpenAI:https://openai.com/ 📘 Midjourney:https://www.midjourney.com/ 📘 Midjourney Discord 服务器:https://discord.gg/midjourney 📘 Stable Diffusion:https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb 📘 CompVis:https://github.com/CompVis 📘 Stability AI:https://stability.ai/ 📘 LAION:https://laion.ai/ 📘 Dream Studio Web 应用程序:https://beta.dreamstudio.ai/ 📘 Diffuse the Rest:https://huggingface.co/spaces/huggingface/diffuse-the-rest

参考:https://blog.csdn.net/ShowMeAI/article/details/127798793

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-03-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Stable Diffusion 保姆级培训课程
Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说,我们只要给出想要的图片的文字描述在提Stable Diffusion就能生成符合你要求的逼真的图像!
曾高飞
2025/06/13
1450
AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵
随着 Diffusion Model 的普及,大家可能注意到互联网上有着铺天盖地的人工智能 (AI) 生成的图像,这些图像都是使用『文本到图像』的生成模型生成的:只需要输入一个文本描述(prompt/提示),AI 模型就可以在几秒几分钟内生成一个或多个精准匹配提示的精美图像。
ShowMeAI
2022/11/30
3.9K0
AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵
Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评
昨天,Stability AI宣布,Stable Diffusion 2.0版本上线!
新智元
2023/01/08
3.7K1
Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评
中国风?古典系?AI中文绘图创作尝鲜!⛵
图片本文对百度开源的中文 AI 图像生成器 ERNIE 进行讲解,包括工具简介、通过Demo页面和API两种使用方式,以及使用中文提示词生成的图像效果。---💡 作者:韩信子@ShowMeAI📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42📘 本文地址:https://www.showmeai.tech/article-detail/413📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容💡 引言图片人工智能图像生成器
ShowMeAI
2022/12/20
9930
中国风?古典系?AI中文绘图创作尝鲜!⛵
开源文生图模型再进化,Stable Diffusion XL 1.0登场,出图效果不输Midjourney
在大模型开启的 AIGC 时代,由明星 AI 初创公司 Stability AI 打造的文本到图像生成模型 Stable Diffusion 可谓风靡全球。
机器之心
2023/08/08
6520
开源文生图模型再进化,Stable Diffusion XL 1.0登场,出图效果不输Midjourney
AI数字绘画 stable-diffusion 保姆级教程
prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream
秋风的笔记
2022/12/05
2.6K0
AI数字绘画 stable-diffusion 保姆级教程
ChatGPT 之后,再玩玩 Stable-Diffusion
前些天体验的 ChatGPT 主要用来进行文本方面的处理,那么图片生成有没有这样的 AI 工具 呢?答案是肯定的。
oec2003
2023/02/28
1.2K0
ChatGPT 之后,再玩玩 Stable-Diffusion
消费级GPU可用,文本转图像开源新模型Stable Diffusion生成宇宙变迁大片
机器之心报道 编辑:小舟 Stable Diffusion 模型无需预处理和后处理,几秒钟内就能创造出令人惊叹的艺术图像。 根据文本生成图像是近来大火的一个研究方向。无论是英伟达的 GauGAN,还是 OpenAI 的 DALL·E,都获得了令人印象深刻的结果。但这些模型都是参数量过亿的超大模型,普通的消费级 GPU 根本无法支持。 现在,来自慕尼黑大学和 Runway 的研究者基于其 CVPR 2022 的论文《High-Resolution Image Synthesis with Latent Dif
机器之心
2022/08/26
1.6K0
消费级GPU可用,文本转图像开源新模型Stable Diffusion生成宇宙变迁大片
画笔之争!Dall-E 3 vs MidJourney 5.2 vs Stable Diffusion XL:AI绘画三强PK!
Dall-E 3是OpenAI最新发布的AI图像生成器,近期在AI领域引起了广泛的关注。它以其卓越的能力令人瞩目,成为了人们热议的话题。相较于之前的Dall-E版本,它在连贯性和图像质量方面有了显著的提升,给人们留下了深刻的印象。
架构狂人
2023/11/09
1.3K0
画笔之争!Dall-E 3 vs MidJourney 5.2 vs Stable Diffusion XL:AI绘画三强PK!
Stable Diffusion v1v2 解读
是图像编码器和文本编码器的组合,其训练过程可以简化为拍摄图像和文字说明,使用两个编码器对数据分别进行编码,然后使用余弦距离比较结果嵌入,刚开始训练时,即使文本描述与图像是相匹配的,它们之间的相似性肯定也是很低的。随着模型的不断更新,在后续阶段,编码器对图像和文本编码得到的嵌入会逐渐相似。通过在整个数据集中重复该过程,并使用大 batch size 的编码器,最终能够生成一个嵌入向量,其中狗的图像和句子「一条狗的图片」之间是相似的。就像在 word2vec 中一样,训练过程也需要包括不匹配的图片和说明的负样本,模型需要给它们分配较低的相似度分数。
iResearch666
2023/09/13
1.7K0
Stable Diffusion v1v2 解读
中秋专题:火爆艺术圈的文本图像生成是什么?
最近文本生成图像AI又火爆了起来,并且频频上热搜,在知乎热榜上都会看到相关的问题出现:
算法一只狗
2022/11/04
7480
最容易理解的解释Stable Diffusion(稳定扩散)原理的文章之一
在AI盛行的当下,文本生成领域由ChatGPT独领风骚,文生图领域的头部则要数Midjourney和Stable Diffusion了。本文的主旨是向大家介绍Stable Diffusion的原理,后续会推出几期Stable Diffusion相关的干货分享,敬请期待。
山行AI
2023/09/08
1.2K0
最容易理解的解释Stable Diffusion(稳定扩散)原理的文章之一
分享15个全球顶尖的AIGC图片生成平台
人工智能正在改变许多行业的格局,而其中改变最直观和影响最大的就是AIGC领域的图像创作。
非喵鱼
2022/12/31
33.1K0
分享15个全球顶尖的AIGC图片生成平台
AIGC:DALL·E 2, Stable Diffusion和 Midjourney工作原理简介
在过去的几年里,人工智能(AI)取得了极大的进展,而AI的新产品中有AI图像生成器。这是一种能够将输入的语句转换为图像的工具。文本转图像的AI工具有许多,但最突出的就属DALLE 2、Stable Diffusion和Midjourney了。
Freedom123
2024/03/29
5140
AIGC:DALL·E 2, Stable Diffusion和 Midjourney工作原理简介
Midjourney V6来袭!性能对标DALL·E 3,争夺地表最强作图AI称号
凑热闹的网友们也晒出了同一个Prompt用DALL·E 3和Midjourney作画的对比图。
新智元
2023/10/04
4540
Midjourney V6来袭!性能对标DALL·E 3,争夺地表最强作图AI称号
Stable Diffusion又出大招!「文生动画」震撼发布淘汰导演,DC英雄一秒变身
---- 新智元报道   编辑:Aeneas 润 【新智元导读】Stability AI又来卷了AI视觉圈了!Stable Animation震撼发布,动画效果令人惊叹。 Stability AI又放大招! 现在,Stable Diffusion也能生成视频了。AI届,实在是太卷了。 昨天,Stability AI发布了一款专为艺术家和开发人员设计的工具——Stable Animation SDK。用户可以通过多种方式创建令人惊叹的动画效果。 此前,Runway的Gen-2就相当炸裂,宣传词非常霸
新智元
2023/05/15
3850
Stable Diffusion又出大招!「文生动画」震撼发布淘汰导演,DC英雄一秒变身
高中教师养出40亿美元超级独角兽,Stable Diffusion背后数据集创建者,还发布ChatGPT最大平替
杨净 发自 凹非寺 量子位 | 公众号 QbitAI 他本是一位普普通通的高中教师,却活生生养出一个估值40亿美元独角兽。 而且方法也是非常的独特—— 打造了世界最大的免费开源数据集,却从未从中收取过一分钱,也婉拒了各类工作的邀请。 他叫舒曼,在德国汉堡市的高中教物理和计算机科学。 两年前他创立了LAION(相当于CLIP图文数据集),如今被用于各种生成模型,包括谷歌Imagen、Parti,以及惊艳全球的Stable Diffusion。 就连Stable Diffuision背后公司Stability
量子位
2023/05/06
1320
高中教师养出40亿美元超级独角兽,Stable Diffusion背后数据集创建者,还发布ChatGPT最大平替
Stable Diffusion 3 真正来了
在人工智能应用领域,文生图(Text-to-Image)一直是一个重要的研究领域。通过将文本描述转换为对应的图像,广泛应用在艺术创作、广告设计、游戏开发等工作中。
云水木石
2024/06/26
2930
Stable Diffusion 3 真正来了
Hugging Face发布diffuser模型AI绘画库初尝鲜!
图片💡 作者:韩信子@ShowMeAI📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42📘 TensorFlow 实战系列:https://www.showmeai.tech/tutorials/43📘 本文地址:https://www.showmeai.tech/article-detail/312📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容图片工具库 transformers 的开源方 Hugging Face
ShowMeAI
2022/10/27
1.5K0
Hugging Face发布diffuser模型AI绘画库初尝鲜!
Stable Diffusion的入门介绍和使用教程
Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它,如下图所示。
deephub
2023/01/18
7.2K0
推荐阅读
相关推荐
Stable Diffusion 保姆级培训课程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档