前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >腾讯发布EMO的开源平替V-Express,可以根据单张照片生成对口型的说话视频

腾讯发布EMO的开源平替V-Express,可以根据单张照片生成对口型的说话视频

作者头像
deephub
发布2024-06-03 19:37:45
3120
发布2024-06-03 19:37:45
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

腾讯AI实验室与南京大学合作开发了一款前沿的头像视频生成模型V-Express,该模型能够根据单张个人照片生成高质量的说话视频。V-Express通过独特的渐进式训练和多信号融合技术,实现了对音频、姿势和图像等多种控制信号的精准处理,尤其优化了在音频信号较弱情况下的视频生成效果。

V-Express的核心技术包括条件丢弃和渐进式训练,这两种方法能够在训练过程中逐步提升较弱控制信号的影响力,确保生成的视频既逼真又符合用户预期。此外,该模型还引入了多信号融合技术,能够整合文本、音频、图像参考、姿势和深度图等多种信号,通过生成网络创建符合所有信号要求的视频内容。

V-Express特别适用于需要生成逼真头像视频的开发者和研究人员,如人机交互、虚拟助手、游戏和娱乐领域的专业人士。例如,该模型可以用于生成特定人物的虚拟新闻主播视频,为在线教育平台创建虚拟教师,或在游戏开发中生成非玩家角色的对话动画。

实验验证显示,V-Express在处理音频等弱信号方面表现卓越,能够生成高质量的肖像视频,视频的口型动作和面部表情与音频高度同步,显著提升了视频的自然度和真实感。

通过技术创新和实际应用的结合,V-Express不仅提高了视频生成的质量和效率,还为相关领域的研究与开发打开了新的可能性,推动了视频生成技术的发展。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云小微
腾讯云小微,是一套腾讯云的智能服务系统,也是一个智能服务开放平台,接入小微的硬件可以快速具备听觉和视觉感知能力,帮助智能硬件厂商实现语音人机互动和音视频服务能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档