Hugging Face推出的最新的开源的文本到语音(TTS)模型Parler-TTS可以通过输入提示控制生成语音的风格,这样可以让语音听起来更加流畅。
并且这个模型是完全开源的,包括模型权重、数据集、预处理和训练代码。这样我们就可以根据自己的数据集进行微调训练,生成我们自己的语音。
不过经过测试这个模型目前还不支持中文,需要我们等待官方更新或者大佬进行魔改。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货