Mac版GPT-SoVITS-WebUI一键启动整合包
GPT-SoVITS是一个功能强大的开源文本到语音转换(TTS)项目。它可以通过仅仅使用1分钟的音频样本来克隆特定的声音,并且支持多语言文本转换。该项目以其便捷的部署、快速的训练速度以及优秀的转换效果受到用户好评。
核心功能
零样本文本到语音(TTS):输入5秒的声音样本,立即体验文本到语音转换的魅力。
少样本TTS:只需1分钟的训练数据,便可微调模型,进一步提高声音的相似度和真实感。
跨语言支持:实现了对英语、日语和中文等语言的支持,即便是与训练数据集不同的语言也能进行高质量的推理。
WebUI工具集成:提供了一系列辅助工具,包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注等,帮助初学者更加便捷地创建训练数据集和使用GPT/SoVITS模型。
为了让用户更加轻松地使用这一工具,Mac爱范团队制作了一键启动的整合包。用户通过简单的点击操作即可使用GPT-SoVITS,免去了复杂的下载和配置流程。整合包的下载地址为:https://aifun.fans/117/,请在页面右侧区域点击下载。
特点
一键启动:无需安装Xcode command-line tools、brew工具或其他软件,如git、ffmpeg。
预训练模型内置:包含了所有必要的预训练模型,无需用户再次下载。
GPT-SoVITS Models预训练模型
UVR5(人声/伴奏分离和混响移除)预训练模型
中文自动语音识别(附加)预训练模型:Damo ASR Model, Damo VAD Model, 和 Damo Punc Model
支持推理和训练:用户可以使用该整合包进行模型推理和训练操作。
安装及使用步骤
解压下载的压缩包:解压后,您会看到包含run.command文件的目录结构。
启动整合包:双击run.command文件,实现一键启动。
启动截图
查看终端输出:运行后,终端会显示相关信息,您可以在此界面查看命令行输出。
终端界面
访问WebUI:整合包会自动打开浏览器并访问 http://localhost:9874/。
WebUI界面
完成以上步骤后,您便可以开始愉快地使用GPT-SoVITS-WebUI了。若需要更多帮助,可参考网上的众多使用教程,或访问中文教程文档:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e。
领取专属 10元无门槛券
私享最新 技术干货