LaDI-VTON: Latent Diffusion Textual-Inversion Enhanced Virtual Try-On

image-20230807102743722
基于Stable Diffusion架构,为了增强文图生成模型虚拟试衣的能力,修改了网络结构使得输入为衣服和模特的姿态,同时为了保留衣服细节,提出了前向textual inversion,最后使用masked skip connections提升SD的图像重建自编码器,从而提高了图像生成质量且更好地保留了模特图的细粒度细节。

image-20230808135322123

image-20230808150225064

image-20230808143928254

image-20230808144304322
coarse2fine

image-20230808144448627

image-20230808144457075

image-20230808151741401
本文分享自 iResearch666 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!