首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

活动报名:4天达5.9k星多榜单第一,Yann LeCun转发,腾讯开源PhotoMaker,一作李震分享

报告主题:PhotoMaker,一种高效个性化定制人像照片的文生图模型

报告日期:1月22日(本周一) 14:30直播

腾讯PhotoMaker是一种高效个性化定制人像照片的文生图模型,发布4天已达5.9k星,Yann LeCun转发「左下角这幅文艺复兴时期的画,是我的最爱」。该工作现已开源,论文一作李震将在1月22日下午14:30在智源社区进行分享,欢迎报名参与讨论。

主题简介:

在研究界还是企业界主流的进行个性化人像定制的方法仍然为基于DreamBooth+LoRA的方式。这类方法有三个显著的缺点:1、定制速度很慢(往往大于10分钟);2、GPU资源消耗大(基于SDXL模型的定制过程显存消耗大于20G);3、需要用户提供的图像数量多(往往大于15张自拍照才有很好的效果)。

在这个工作中,我们提出了一种新的高效的个性化人像定制方法——PhotoMaker。通过我们的方法,在用户输入少量图像(1-10张)的前提下,只需要数秒就可以完成一次个性化人像定制。大大提升了定制过程的效率。

与此同时,我们方法的身份信息保持度甚至优于之前方法。此外,我们的方法还可以扩展到之前方法很难甚至无法做到的应用场景中,比如将艺术作品或者老照片中的人物带回现实中、或是将不同人物的身份特点混合在一起创造出一个新的人物。

该工作开源三天Githubstar数已过3千次,已列入Github官方Trending榜第一位,PaperswithCode热度榜第一位,HuggingFace Spaces趋势榜第一位。感谢大家关注。

项目主页:

https://photo-maker.github.io/

线上体验:

https://huggingface.co/spaces/TencentARC/PhotoMaker-Style

报告嘉宾:

李震,南开大学程明明教授课题组四年级博士生。目前共发表CCF-A类顶会及顶刊9篇,其中第一作者5篇。谷歌学术引用共计1400余次,图像及视频的复原、编辑以及生成。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OTH4IDBBEh2QNytF7RTUo0Wg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券