Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >AI绘画专栏之 SDXL 4G显存就能跑SDXL ?SD1.7或将对F8优化merge(46)

AI绘画专栏之 SDXL 4G显存就能跑SDXL ?SD1.7或将对F8优化merge(46)

原创
作者头像
疯狂的KK
发布于 2023-11-26 01:30:12
发布于 2023-11-26 01:30:12
2.7K00
代码可运行
举报
文章被收录于专栏:Java项目实战Java项目实战
运行总次数:0
代码可运行

关于SDXL的生态目前还未完全稳定,但是不得不提到的就是SDXL的在VAE,CLIP,UNET三大组件的巨大提升,其101亿的参数量是原本SD的N倍,那么对于SDXL的生态介绍我们再次重复一遍。4G的显存都能跑SDXL意味着将来大模型Lora将降低其大小,炼丹炉压力更小~

SDXL为什么强?

0.1参数训练量为101亿 其中BASE模型35 亿 加REFINER模型66亿  SD的8倍???

0.2对Stable Diffusion原先的U-Net(XL Base U-Net 一共14个模块),VAE,CLIP Text Encoder三大件都做了改进。可以明显减少显存占用和计算量

0.3增加一个单独的基于Latent(潜在)的Refiner(炼制)模型,来提升图像的精细化程度。【新增:对Base模型生成的图像Latent特征进行精细化,其本质上是在做图生图的工作。】

0.4设计了很多训练Tricks(技巧)(这些Tricks都有很好的通用性和迁移性,能普惠其他的生成式模型),包括图像尺寸条件化策略,图像裁剪参数条件化以及多尺度训练等。

0.5先发布Stable Diffusion XL 0.9测试版本,基于用户使用体验和生成图片的情况,针对性增加数据集和使用RLHF技术优化迭代推出Stable Diffusion XL 1.0正式版。

0.6采样方法禁用DDIM (保留意见、非绝对),不需要开启CN,随着CN的支持,可以开启CN的XL版本。所有的环境需要都是XL的生态

0.7直接出1024分辨率图片   1024 * 1024  起步

    随之而来的就是对大显存的占用,但随着新的PR的提出,或将在4G的测试显存,并在一定的内存占用上解决!!!

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
A big improvement for dtype casting system with fp8 storage type and manual cast

一个很大的提升对于FP8的内存和手动转换

在 pytorch 2.1.0 之后,pytorch 添加了 2 个新的 dtype 作为存储类型:float8_e5m2、float8_e4m3fn。[1][2] 基于讨论使用 fp8 作为训练/使用 NN 模型的参数/梯度的论文。我认为值得对 fp8 格式进行一些优化。[3][4] 此外,一些扩展也已经支持这个功能[5]

速度提升

由于将 FP8 与 FP16 一起使用,因此计算需要一些额外的操作来强制转换 dtype。 它会降低速度(特别是对于较小的批量)

批量大小

768x768 标清1.x fp16

768x768 标清1.x fp8

1024x1024 SDXL fp16

1024x1024 SDXL fp8

1

8.27 秒/秒

7.85 秒/秒

3.84 秒/秒

3.67 秒/秒

4

3.19 秒/秒

3.08 秒/秒

1.51 秒/秒

1.45 秒/秒

会降低质量吗?几乎不会

什么是FP8  FP16?

Fp16:意味模型用16位浮点数存,相对于Fp32更小更快,但是无法用于CPU,因为有的半浮点精度运算在CPU上不支持。通常为了更快的运算,在GPU上我们也会将Fp32转换成Fp16,这个可以在设置里配置。那么随之而来的一个params是8个byte(字节),FP32就是4个byte,FP8就是一个Byte,FP或者BF16相对已经是比较好的出图质量了。

以下测试结果来自原PR作者琥珀青叶,如果你想要尝试,在源码中切换此PR即可

首先SD1的时候FP16存下来是2G,SDXL因为参数变多了FP16也要5G,这样很多显卡就hold不住了。 所以青叶做了个事情,就是load的时候用FP8放在显存里,这样SDXL存在显存是2.5G。但是在每一层运算的时候把对应的FP8转到FP16,所以整个计算流程看起来是是一致的。同时整个流程的显存占用也下来的。

正常启动测试

开启FP8并开启内存缓存优化

XYZ测试关闭前后对比

起初的静态内存占用为5.3

运行后稳定在6.4左右

开启前后对图片直连影响很小,有细微细节差距

搭配LCM测试

当前所有的PR审核已经通过,或将在测试后在1.7进行升级推出正式版本

我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
2.2 传输介质
 在这个视频中,我们要探讨传输介质相关的考点。transmission medium是传输介质的英文术语,在有的地方也会把它翻译为传输媒体。考研大纲要求我们了解常用的一些传输介质,包括导向型的和非导向型的。导向型指的是信号是朝着固定方向去传播的,通常来说,有限传输介质就是导向型的。因为信号只能沿着线缆的方向去传播,导向型的传输介质我们需要了解双绞线、同轴电缆和光纤这三种材质。所谓非导向型的就是信号会朝四面八方传播。一般来说,无线通信就属于非导向型的传输介质。在无线通信当中,通常会以电磁波作为信号,而电磁波可以在真空,可以在空气,可以在水中,朝四面八方去传播,它并没有一个固定的传播方向。以上是我们需要了解的几种传输介质,除了传输介质之外,我们还需要了解物理层接口的特性。
用户11290648
2025/06/10
400
2.2 传输介质
各类网线比较,传输距离最大的是哪种 !
小网线也有大学问,不能忽视,对网络比较了解的朋友知道,网线都存在传输距离,好比如在综合布线规范中,也明确要求水平布线不能超过九十米,链路总长度不能超过一百米,也就是说,一百米对于有线以太网而言是一个极限,这个极限是从网卡到集线设备的链路长度。
网络技术联盟站
2023/03/13
1.8K0
各类网线比较,传输距离最大的是哪种 !
超五类网线和超六类网线
"超五类"指的是 超五类 非屏蔽双绞线(UTP—Unshielded Twisted Pair) 非屏蔽双绞线电缆是由多对双绞线和一个塑料外皮构成。五类是指国际电气工业协会为双绞线电缆定义的五种不同的质量级别. 超五类非屏蔽双绞线是在对现有五类屏蔽双绞线的部分性能加以改善后出现的电缆,不少性能参数,如近端串扰、衰减串扰比,回波损耗等都有所提高,但其传输带宽仍为100MHz。 超五类双绞线也是采用4个绕对和1条抗拉线,线对的颜色与五类双绞线完全相同,分别为白橙、橙、白绿、绿、白蓝、蓝、白棕和棕。裸铜
杨强生
2019/03/05
1.1K0
网线数据传输为什么不能超过100米?
对网络比较了解的朋友,都知道双绞线有一个“无法逾越”的“100米”传输距离。无论是10M传输速率的三类双绞线,还是100M传输速率的五类双绞线,甚至1000M传输速率的六类双绞线,有效传输距离为100米。
朗坤君
2021/08/02
2.8K0
入行网工,才知道网线传输距离限制为100米!
无论是100M传输速率的五类双绞线,还是1000M传输速率的六类双绞线,最远有效传输距离都为100米。
ICT系统集成阿祥
2024/12/03
3160
入行网工,才知道网线传输距离限制为100米!
六类网线为啥那么受欢迎,网络工程师必知
目前,国内千兆网络已大规模普及,从前的“销冠”百兆超五类网线已经渐渐淡出了人们的视野,已然被千兆的六类网线取代成为现代布线入门级主力军。万兆超六类网线也同时是城市智能化5G、万物互联时代入门首选,各自顺应时代成为不同领域的布线新宠。
网络技术联盟站
2023/02/03
5280
六类网线为啥那么受欢迎,网络工程师必知
百兆、千兆、POE网络中网线线序
双绞线可分为屏蔽双绞线(STP)和非屏蔽双绞线(UTP)两种。在工程中,如无特殊要求,一般都是使用UTP网线。
似水的流年
2020/09/03
8.1K0
【计算机网络】物理层 : 传输介质 ( 导向性传输介质 | 双绞线 | 同轴电缆 | 光纤 | 非导向性传输介质 | 无线电波 | 微波 | 红外线 、激光 )
传输媒体 ( 纯物理通路 ) : 传输媒体 中 传输 波形信号 , 但是 并不知道 传输信号的 意义 ; 只是 单纯的作为 物理通路 ;
韩曙亮
2023/03/28
2.4K0
【计算机网络】物理层 : 传输介质 ( 导向性传输介质 | 双绞线 | 同轴电缆 | 光纤 | 非导向性传输介质 | 无线电波 | 微波 | 红外线 、激光 )
网络芯片Auto MDI-X
交叉线(crossover cable):一头是568A标准,另外一头是568B标准。
徐师兄
2022/08/29
1.1K0
网络芯片Auto MDI-X
无法超越的100米_百兆以太网传输距离_网线有哪几种?
对网络比较了解的朋友,都知道双绞线有一个“无法逾越”的“100米”传输距离。无论是10M传输速率的三类双绞线,还是100M传输速率的五类双绞线,甚至1000M传输速率的六类双绞线,最远有效传输距离为100米。在综合布线规范中,也明确要求水平布线不能超过90米,链路总长度不能超过100米。也就是说,100米对于有线以太网而言是一个极限,这个极限是从网卡到集线设备的链路长度。
利又德智能感知
2022/08/02
1K0
无法超越的100米_百兆以太网传输距离_网线有哪几种?
家庭网络系统规划设计与布线指南
随着未来5G移动网络技术的发展,运营商的网络带宽不断提高以及最新的WiFi6网络标准的推出,对网络的设计标准也需要不断提高。
SDNLAB
2020/04/26
3K0
家庭网络系统规划设计与布线指南
光纤能取代网线吗?
光纤与铜缆之间的较量已持续了十多年。现如今随着云计算、5G 等新型业务的不断涌现,数据中心规模不断的扩大,其架构与布线也越来越复杂,而光纤的轻量化及逐渐降低的成本,使得主干网设备对光纤的需求也越来越旺盛,在大型数据中心中光纤的占比率高到 70%以上,远远高出铜缆。那么这是否意味着铜缆会被光纤完全取代呢?其实不然,接下来武汉利又德的小编来聊聊到底光纤能取代网线吗?
利又德智能感知
2023/02/02
8360
光纤能取代网线吗?
PoE交换机供电网线 擦亮双眼识别网线真假优劣
市面的非标准网线材质主要有铜包钢、铜包铝、铜包铁等,这些网线的阻值大,都不适合用来POE供电。POE IEEE 802.3af标准要求PSE输出端口的输出功率为15.4W或者15.5W, 传输100米后的PD设备接受功率必须不小于12.95W。
用户5783137
2019/07/08
7750
PoE交换机供电网线 擦亮双眼识别网线真假优劣
5分钟搞懂网线的水晶头超5类和6类的区别
5类水晶头的8根线芯是一字排开的,而6类水晶头的8根线芯是呈现上、下交错的形式排列。
杰哥的IT之旅
2021/09/03
24.9K0
poe交换机如何选择_怎么选择交换机
PoE交换机不但可以实现普通交换机的数据传输功能还能同时对网络终端进行供电 。如果你打算选择或者使用PoE交换机,这些知识点一定要看,可以让你少走弯路、少些麻烦。接下来,杭州飞畅科技的小编来为大家介绍下PoE交换机的选择和使用要点,一起来看看吧!
全栈程序员站长
2022/11/09
4950
poe交换机如何选择_怎么选择交换机
屏蔽双绞线与非屏蔽双绞线的全面对比
非屏蔽双绞线(UTP) 就是我们日常最常见的那种网线,比如家里用的超五类(CAT5e)、六类(CAT6)大多数都是它。
神的孩子都在歌唱
2025/05/18
1490
屏蔽双绞线与非屏蔽双绞线的全面对比
【零基础收藏】网络介质(光纤及双绞线)最强解析
很多小伙伴零基础就业,也有转行过来的大佬。但是身为一个网络工程师,有些基础常识必须要知道。
Ponnie
2021/07/05
1.8K0
【零基础收藏】网络介质(光纤及双绞线)最强解析
有线网络和无线网络的区别
顾名思义,就是通过线连接,我们现在的家庭网络,以前上网基本都通过电话线接入,现在都是光纤入户,通过光缆接入网络,
简单并不简单
2019/07/22
16.1K0
有线网络和无线网络的区别
学会自己制作网线水晶头,水晶头(RJ45)接法
现在是一个电脑普及的时代,但是当自己电脑的网线坏掉的时候,你是不是也想自己学如何制作网线水晶头呢?
zeruns
2020/04/15
6.9K0
学会自己制作网线水晶头,水晶头(RJ45)接法
8000字34张图史诗级介绍同轴电缆、双绞线、光纤等线缆,超级详细!
各种线缆对于网络工程师来说应该是最为熟悉的东西了,线缆有很多种,比如直连线、交叉线、同轴电缆等,但是你知道不同种类的线缆,它们长啥样子吗?每种线缆的用途有哪些?本文瑞哥就带着大家好好学习一下这方面的知识点,如果觉得文章对您有所帮助,别忘了点赞转发哦,让我们直接开始!
网络技术联盟站
2023/03/01
1.9K0
8000字34张图史诗级介绍同轴电缆、双绞线、光纤等线缆,超级详细!
推荐阅读
相关推荐
2.2 传输介质
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验