首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

最简单AI数字人整合包VideoReTalking,一键生成AI数字人!

最简单AI数字人整合包VideoReTalking,一键生成AI数字人!

VideoReTalking:让视频中的人物的嘴型与输入的声音同步。

你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。

工作流程:

整个系统的工作流程分为三个主要步骤:面部视频生成、音频驱动的嘴型同步和面部增强。所有这些步骤都是基于学习的方法,并且可以在一个顺序的流程中完成,无需用户干预。

1、面部视频生成:首先,系统会使用表情编辑网络来修改每一帧的表情,使其与一个标准表情模板相符,从而生成一个具有标准表情的视频。

2、音频驱动的嘴型同步:然后,这个视频和给定的音频一起被输入到嘴型同步网络中,生成一个嘴型与音频同步的视频。

3、面部增强:最后,系统通过身份感知的面部增强网络和后处理来提高合成面部的照片真实性。

注意电脑配置如下:

windows 10/11

8G显存以上英伟达显卡

下载压缩包下载地址:https://xueshu.fun/3161/,在此页面右侧区域点击下载!

解压,最好不要有中文路径,解压后,如下图所示,双击启动.exe文件运行

浏览器访问http://127.0.0.1:7860/,即可在浏览器使用

和其他数字人项目区别

SadTalker:图片+音频说话,https://xueshu.fun/2824/

Wav2lip:将一个不说话的视频说话,https://xueshu.fun/3106/

Video-retalking:将一个说话的视频,改成说成你要改的话

常见问题

视频不宜过长,生成视频会循环使用源视频,无需上传长视频

视频为标准MP4格式、视频中只有一张人脸、每帧都要有人脸、人脸清晰可识别,人脸不过过大

只支持N卡,需要8G以上显存

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OTlJ1Mv_HSd8OrtQ6nfcrLlw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券