首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Mac版GPT-SoVITS-WebUI一键启动整合包

Mac版GPT-SoVITS-WebUI一键启动整合包

GPT-SoVITS是一个功能强大的开源文本到语音转换(TTS)项目。它可以通过仅仅使用1分钟的音频样本来克隆特定的声音,并且支持多语言文本转换。该项目以其便捷的部署、快速的训练速度以及优秀的转换效果受到用户好评。

核心功能

零样本文本到语音(TTS):输入5秒的声音样本,立即体验文本到语音转换的魅力。

少样本TTS:只需1分钟的训练数据,便可微调模型,进一步提高声音的相似度和真实感。

跨语言支持:实现了对英语、日语和中文等语言的支持,即便是与训练数据集不同的语言也能进行高质量的推理。

WebUI工具集成:提供了一系列辅助工具,包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注等,帮助初学者更加便捷地创建训练数据集和使用GPT/SoVITS模型。

为了让用户更加轻松地使用这一工具,Mac爱范团队制作了一键启动的整合包。用户通过简单的点击操作即可使用GPT-SoVITS,免去了复杂的下载和配置流程。整合包的下载地址为:https://aifun.fans/117/,请在页面右侧区域点击下载。

特点

一键启动:无需安装Xcode command-line tools、brew工具或其他软件,如git、ffmpeg。

预训练模型内置:包含了所有必要的预训练模型,无需用户再次下载。

GPT-SoVITS Models预训练模型

UVR5(人声/伴奏分离和混响移除)预训练模型

中文自动语音识别(附加)预训练模型:Damo ASR Model, Damo VAD Model, 和 Damo Punc Model

支持推理和训练:用户可以使用该整合包进行模型推理和训练操作。

安装及使用步骤

解压下载的压缩包:解压后,您会看到包含run.command文件的目录结构。

启动整合包:双击run.command文件,实现一键启动。

启动截图

查看终端输出:运行后,终端会显示相关信息,您可以在此界面查看命令行输出。

终端界面

访问WebUI:整合包会自动打开浏览器并访问 http://localhost:9874/。

WebUI界面

完成以上步骤后,您便可以开始愉快地使用GPT-SoVITS-WebUI了。若需要更多帮助,可参考网上的众多使用教程,或访问中文教程文档:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OsCAdyE3G919VO81f4eUGAEA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券