想象一下,你有一张好友的照片,突然间,这张照片里的人开始对你说话,表情丰富,就像真人一样。
这听起来像是科幻电影中的场景,但现在这已经成为现实。又有开源的AI模型能做到一段录音+一张照片=一个能说话的视频了
什么是AniTalker?
AniTalker它不仅仅关注嘴唇同步这样的口型动作,还能捕捉到面部表情和头部动作等非语言提示的复杂动态。这意味着,AniTalker生成的视频不仅嘴型准确,而且表情自然,动作流畅。
AniTalker如何工作?
AniTalker使用了一种称为“通用运动表示”的技术。通过自监督学习策略,AniTalker能够学习和重建目标视频帧中的微妙运动表现,同时通过度量学习发展一个身份编码器,有效地将身份信息和运动信息分离。这样做的好处是,生成的动画不会包含特定个体的身份信息,使得动画更加多样化和可控制。
项目地址:
https://x-lance.github.io/AniTalker/
领取专属 10元无门槛券
私享最新 技术干货