我有一台带有 Quadro P5000 显卡的机器,运行 Windows 10。我想在这个系统上训练 TTS 语音。我需要安装什么才能使它正常工作?
GitHub 开源项目:https://github.com/coqui-ai/TTS
以下是要安装/执行的操作:
.\Scripts\pip install torch==1.8.0+cu101 torchvision==0.9.0+cu101 torchaudio===0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
import torch
x = torch.rand(5, 3)
print(x)
print(torch.cuda.is_available())
tensor([[0.2141, 0.7808, 0.9298],
[0.3107, 0.8569, 0.9562],
[0.2878, 0.7515, 0.5547],
[0.5007, 0.6904, 0.4136],
[0.2443, 0.4158, 0.4245]])
True
set PYTHONIOENCODING=UTF-8
set PYTHONLEGACYWINDOWSSTDIO=UTF-8
set PHONEMIZER_ESPEAK_PATH=C:/Program Files/eSpeak NG/espeak-ng.exe
.\Scripts\python.exe ./TTS/bin/train_tacotron.py --config_path "C:/path/to/your/config.json"
如果您使用的模型与 Tacotron 不同,或者需要将其他参数传递到训练脚本中,请随时进一步自定义train.bat。
如果您刚刚开始一般的 TTS 培训,请查看如何开始在 Ubuntu 20.04 上使用 Mozilla TTS 培训自定义语音模型?.
我已经抓取了 Microsoft Speech SDK 的文档以及开发人员网站,例如https://learn.microsoft.com/en-us/dotnet/api/system.speech.synthesis.ttsengine
您应该查看TTS Engine Vendor Porting Guide。您需要实现 ISpTTSEngine,它完成所有工作,以及ISpObjectWithToken,它管理注册和创建。