Uni-ControlNet: All-in-One Control to Text-to-Image Diffusion Models
image
image-20230829101505782
每个条件单独一个适配器模型,非统一
image-20230829101738798
image-20230829101922641
image-20230829103238330
image-20230829104105009
上面就是将不同尺度的噪声和特征进行相加,2个学习参数分别学习空间敏感的尺度和偏移调制
zero是零卷积
调制采用乘法,直接和噪声相乘
注意:局部图像条件没有用CLIP,而是用CNN提取特征,ControlNet就是采用CLIP提取image token embeddings
image-20230829105342752
image-20230829105606626
image-20230829110339463
本文分享自 iResearch666 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!