前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >热门开源项目ChatTTS: 国内语音技术突破,实现弯道超车

热门开源项目ChatTTS: 国内语音技术突破,实现弯道超车

作者头像
Srlua
发布2024-06-17 09:14:32
2110
发布2024-06-17 09:14:32
举报
文章被收录于专栏:CSDN社区搬运CSDN社区搬运

热门开源项目ChatTTS推荐

随着开源程序的发展,越来越多的程序员开始关注并加入开源大模型的行列。每个人对开源行业和项目的关注点各不相同,现在快来加入我们的开源热门项目推荐活动,分享你感兴趣的热门项目吧!

chattts作者本人也在 x 上表示,ChatTTS 突破了开源天花板。不过,目前开源的只是底模,没有经过 SFT 监督微调。

​​最像人声的AI来了!语音开源天花板ChatTTS火速出圈,3天就斩获9k个star。

项目地址:https://github.com/2noise/ChatTTS/tree/main

ChatTTs是一种语音合成技术,它使用先进的人工智能算法和模型来生成自然流畅的语音输出。通过ChatTTs,计算机可以将文本转化为逼真的人声,并以多种语音风格和语调进行表达。这项技术在语音助手、虚拟主播、有声读物等领域具有广泛的应用潜力。

开源项目“ChatTTS”是一个文本转语音的工具,它具有以下特点:

1. 多语言支持:ChatTTS不仅可以说中文,还可以说英文,对于多种语言的转换都能应对自如。

2. 细粒度控制:该工具支持一些细节的控制,例如加入笑声、停顿和语气词,使得生成的语音更加生动有趣。

3. 逝去声音的复刻:ChatTTS能够复刻已经逝去的人的声音,例如乔布斯的发布会,让你随时可以重新聆听。

4. 高度逼真的模仿:无论是语调还是语气的变化,ChatTTS都能准确地模仿,并且几乎听不出来是由AI生成的。

5. 中英文混合:ChatTTS能够灵活处理中英文混合的情况,表现出半中半英的流利口音,展现出高水平的语言能力。

通过这些功能,ChatTTS在文本转语音的领域已经达到了一个新的水平。希望这个项目能够为用户带来更好的体验和更多的可能性。

如何部署使用ChatTTS?

1.从GitHub下载

从GitHub下载代码。

代码语言:javascript
复制
git clone https://github.com/2noise/ChatTTS

2.安装依赖项

在开始之前,请确保已安装所需的软件包。您将需要torch和ChatTTS。如果尚未安装,可以使用pip安装:

代码语言:javascript
复制
pip install torch ChatTTS

3.导入所需库

为您的脚本导入必要的库。您将需要torch、ChatTTS和IPython.display中的Audio。

代码语言:javascript
复制
import torch
import ChatTTS
from IPython.display import Audio

4.初始化ChatTTS

创建ChatTTS类的实例并加载预训练模型。

代码语言:javascript
复制
chat = ChatTTS.Chat()
chat.load_models()

5.准备文本

定义要转换为语音的文本。将<YOUR TEXT HERE>替换为您想要的文本。

代码语言:javascript
复制
texts = ["你好,欢迎使用ChatTTS!"]

6.生成语音

使用infer方法从文本生成语音。设置use_decoder=True以启用解码器。

代码语言:javascript
复制
wavs = chat.infer(texts, use_decoder=True)

7.播放音频

使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放。

代码语言:javascript
复制
Audio(wavs[0], rate=24_000, autoplay=True)

8.完成脚本

这是供参考的完整脚本:

代码语言:javascript
复制
import torch
import ChatTTS
from IPython.display import Audio

# 初始化ChatTTS
chat = ChatTTS.Chat()
chat.load_models()

# 定义要转换为语音的文本
texts = ["你好,欢迎使用ChatTTS!"]

# 生成语音
wavs = chat.infer(texts, use_decoder=True)

# 播放生成的音频
Audio(wavs[0], rate=24_000, autoplay=True)

在线网站使用

如何觉得部署较为麻烦的,可以选择在线网站进行免费使用~

体验地址:

ChatTTS: Text-to-Speech For Chat

效果反馈:

项目一经发布,各路网友纷纷试用起来,给出了声音确实真假难辨。

还有人拿 GPT 生成文本,让 ChatTTS「读」出来,语气语调和真人的差距非常小:

常见问题

​​​

希望对你有帮助!加油!

若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 热门开源项目ChatTTS推荐
  • 如何部署使用ChatTTS?
    • 1.从GitHub下载
      • 2.安装依赖项
        • 3.导入所需库
          • 4.初始化ChatTTS
            • 5.准备文本
              • 6.生成语音
                • 7.播放音频
                  • 8.完成脚本
                  • 在线网站使用
                    • 体验地址:
                    • 常见问题
                    相关产品与服务
                    语音合成
                    语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档