Stars: 25.5k
License: MIT
GPT-SoVITS 是一个强大的少样本语音转换和文本到语音 WebUI。 该项目主要功能、关键特性、核心优势包括:
Stars: 6.4k
License: MIT
vits 是一个用于端到端文本转语音的条件变分自动编码器和对抗学习的项目。 该项目提出了一种并行端到端 TTS 方法,采用了变分推断、正则化流和对抗训练过程,以改善生成建模的表现力。此外,还提出了一种随机持续时间预测器,可以从输入文本中合成具有不同节奏的语音。通过概率建模来表达自然多样性关系,并在主观人类评估中显示出优异性能。
Stars: 4.2k
License: MIT
这个项目是 StyleTTS 2,它是一个文本到语音 (TTS) 模型,通过使用大规模语音语言模型的风格扩散和对抗训练来实现人类级别的 TTS 合成。其主要功能包括利用扩散模型将风格建模为潜在随机变量以生成最适合文本的样式,并采用大规模预训练 SLM 作为鉴别器进行端到端培训。该项目具有以下关键特点和核心优势:
Stars: 3.8k
License: MIT
MeloTTS 是 MyShell.ai 开发的高质量多语言文本转语音库。
Stars: 3.5k
License: MIT
WhisperSpeech 是一个通过反向 Whisper 构建的开源文本到语音系统。 该项目的主要功能、关键特性和核心优势包括: