前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >T2I-Adapter 多图像条件控制文生图

T2I-Adapter 多图像条件控制文生图

作者头像
iResearch666
发布2023-09-13 14:18:52
6860
发布2023-09-13 14:18:52
举报

T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models


  • paper https://arxiv.org/abs/2302.08453
  • code https://github.com/TencentARC/T2I-Adapter

image-20230830101919618


Abstract

  • T2I 模型可以学习复杂的结构和有意义的语义
  • T2I-Adapters 将T2I内部知识和外部控制信号进行对齐,且冻结T2I模型参数

Contributions

  • 灵活性:不同控制条件(空间颜色控制和复杂结构控制)训练不同的适配器
  • 可组合:将多个适配器组合实现多个条件同时控制
  • 泛化性:T2I是冻结的,只需要对适配器进行微调
  • 轻量化:77M params参数量,300M storage存储量

img

Related Work

Adapter

  • 起源于NLP,对大模型微调效率很低,所以提出用适配器进行transfer,只需要针对特定任务设计适配器,更好的将大模型应用到下游任务中
  • ViT-Adapter

Methodology

Overview

image-20230830103603381

Adapter Design

image-20230830103708164

  • 输入图像512X512,通过pixel unshuffle下采样到64X64
  • 4个特征提取块 + 3个下采样块 = 多尺度特征
    • 特征提取block=1个Conv+2个residual blocks
    • 下采样块
Structure controlling
  • sketch, depth map, semantic segmentation map, and keypose
Spatial color palette
  • hue and spatial distribution
    1. 使用bicubic下采样去除图像语义和结构信息,同时保留足够的color信息
    2. 使用nearest上采样恢复图像原始尺寸color map
    3. 用获取的color map作为条件进行训练
  • color map

image-20230830104959082

Multi-adapter controlling

image-20230830105131707

  • 不需要重新训练,只需要将每个条件的适配器进行线性组合即可,自定义权重,从而实现多个条件以不同权重进行共同控制

img

Experiments

image-20230830105433991

image-20230830105531770

image-20230830105847435

Conclusions

  • 鸡肋

References

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-30 11:10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 iResearch666 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Abstract
  • Contributions
  • Related Work
    • Adapter
    • Methodology
      • Overview
        • Adapter Design
          • Structure controlling
          • Spatial color palette
          • Multi-adapter controlling
      • Experiments
      • Conclusions
      • References
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档