声音克隆 AI是一类人工智能技术,主要用于生成人类或动物的声音,或将一个人的声音模拟成另一个人的声音。
目前主要的声音克隆 AI有以下几种:
WaveNet:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。
Tacotron:由Google开发的声音克隆 AI模型,能够生成人类的语音,并在Google Assistant中使用。
Deep Voice:由Baidu开发的声音克隆 AI模型,能够生成人类的语音。
Lyrebird:开源的声音克隆 AI模型,能够将一个人的声音模拟成另一个人的声音。
VCTK:一个开源的语音数据集,其中包含了109个人的语音数据,可以用来训练声音克隆 AI模型。
VoiceLoop:由Facebook AI Research开发的声音克隆 AI模型,能够生成人类的语音。
VoiceForge:由SRI International开发的声音克隆 AI模型,能够生成人类的语音。
Voice cloning toolkit:一个开源的声音克隆工具包,可以用来训练声音克隆 AI模型。
Real-Time-Voice-Cloning:一个开源的声音克隆工具包,可以用来生成人类语音。
OpenVocoder:一个开源的语音合成和声音克隆 AI模型,可以用来生成人类语音。
DeepSinger:由清华大学开发的声音克隆 AI模型,能够生成人类的语音。
Lyrebird AI:声音克隆 AI模型,能够生成人类的语音。
Google DeepMind WaveNet:一种基于深度学习的声音克隆 AI模型,能够生成人类语音。
VocaliD:声音克隆 AI模型,能够生成人类语音。
Voice-Cloning:声音克隆 AI模型,能够生成人类语音。
Adobe Voco:声音克隆 AI模型,能够生成人类语音。
其中,很多公司都在研究声音克隆技术,可能会有新的声音克隆 AI模型出现,并取得新的进展。
领取专属 10元无门槛券
私享最新 技术干货