首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >热门开源项目ChatTTS: 国内语音技术突破,实现弯道超车

热门开源项目ChatTTS: 国内语音技术突破,实现弯道超车

作者头像
Srlua
发布于 2024-06-17 01:14:32
发布于 2024-06-17 01:14:32
64600
代码可运行
举报
文章被收录于专栏:CSDN社区搬运CSDN社区搬运
运行总次数:0
代码可运行

热门开源项目ChatTTS推荐

随着开源程序的发展,越来越多的程序员开始关注并加入开源大模型的行列。每个人对开源行业和项目的关注点各不相同,现在快来加入我们的开源热门项目推荐活动,分享你感兴趣的热门项目吧!

chattts作者本人也在 x 上表示,ChatTTS 突破了开源天花板。不过,目前开源的只是底模,没有经过 SFT 监督微调。

​​最像人声的AI来了!语音开源天花板ChatTTS火速出圈,3天就斩获9k个star。

项目地址:https://github.com/2noise/ChatTTS/tree/main

ChatTTs是一种语音合成技术,它使用先进的人工智能算法和模型来生成自然流畅的语音输出。通过ChatTTs,计算机可以将文本转化为逼真的人声,并以多种语音风格和语调进行表达。这项技术在语音助手虚拟主播、有声读物等领域具有广泛的应用潜力。

开源项目“ChatTTS”是一个文本转语音的工具,它具有以下特点:

1. 多语言支持:ChatTTS不仅可以说中文,还可以说英文,对于多种语言的转换都能应对自如。

2. 细粒度控制:该工具支持一些细节的控制,例如加入笑声、停顿和语气词,使得生成的语音更加生动有趣。

3. 逝去声音的复刻:ChatTTS能够复刻已经逝去的人的声音,例如乔布斯的发布会,让你随时可以重新聆听。

4. 高度逼真的模仿:无论是语调还是语气的变化,ChatTTS都能准确地模仿,并且几乎听不出来是由AI生成的。

5. 中英文混合:ChatTTS能够灵活处理中英文混合的情况,表现出半中半英的流利口音,展现出高水平的语言能力。

通过这些功能,ChatTTS在文本转语音的领域已经达到了一个新的水平。希望这个项目能够为用户带来更好的体验和更多的可能性。

如何部署使用ChatTTS?

1.从GitHub下载

从GitHub下载代码。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
git clone https://github.com/2noise/ChatTTS

2.安装依赖项

在开始之前,请确保已安装所需的软件包。您将需要torch和ChatTTS。如果尚未安装,可以使用pip安装:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install torch ChatTTS

3.导入所需库

为您的脚本导入必要的库。您将需要torch、ChatTTS和IPython.display中的Audio。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import torch
import ChatTTS
from IPython.display import Audio

4.初始化ChatTTS

创建ChatTTS类的实例并加载预训练模型。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
chat = ChatTTS.Chat()
chat.load_models()

5.准备文本

定义要转换为语音的文本。将<YOUR TEXT HERE>替换为您想要的文本。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
texts = ["你好,欢迎使用ChatTTS!"]

6.生成语音

使用infer方法从文本生成语音。设置use_decoder=True以启用解码器。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wavs = chat.infer(texts, use_decoder=True)

7.播放音频

使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Audio(wavs[0], rate=24_000, autoplay=True)

8.完成脚本

这是供参考的完整脚本:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import torch
import ChatTTS
from IPython.display import Audio

# 初始化ChatTTS
chat = ChatTTS.Chat()
chat.load_models()

# 定义要转换为语音的文本
texts = ["你好,欢迎使用ChatTTS!"]

# 生成语音
wavs = chat.infer(texts, use_decoder=True)

# 播放生成的音频
Audio(wavs[0], rate=24_000, autoplay=True)

在线网站使用

如何觉得部署较为麻烦的,可以选择在线网站进行免费使用~

体验地址:

ChatTTS: Text-to-Speech For Chat

效果反馈:

项目一经发布,各路网友纷纷试用起来,给出了声音确实真假难辨。

还有人拿 GPT 生成文本,让 ChatTTS「读」出来,语气语调和真人的差距非常小:

常见问题

​​​

希望对你有帮助!加油!

若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
分享一款可用于对话场景的文本转语音免费工具
不知道大家在日常的学习、工作中是否有这样的一个情况,当我们阅读完一篇文章,很快就能读完,但印象不会很深;或者说在很多时候,对着电脑、手机看久了,眼睛很疲劳,希望能够通过听觉来接收我们文章的内容。我自己在时常阅读公众号文章,就很喜欢去听,而不是阅读的方式。逐渐发现听内容比阅读内容更容易吸收,而且能够极大的缓解我们的眼睛疲劳。
兔云小新LM
2024/06/10
5370
分享一款可用于对话场景的文本转语音免费工具
6k Star!ChatTTS:开源领域最强的文本到语音转换(TTS)模型!
体验地址:https://huggingface.co/2Noise/ChatTTS
AI进修生
2024/12/02
7060
6k Star!ChatTTS:开源领域最强的文本到语音转换(TTS)模型!
【机器学习】ChatTTS:开源文本转语音(text-to-speech)大模型天花板
我很愿意推荐一些小而美、高实用模型,比如之前写的YOLOv10霸榜百度词条,很多人搜索,仅需100M就可以完成毫秒级图像识别与目标检测,相关的专栏也是CSDN付费专栏中排行最靠前的。今天介绍有一个小而美、高实用性的模型:ChatTTS。
LDG_AGI
2024/08/13
1.5K0
【机器学习】ChatTTS:开源文本转语音(text-to-speech)大模型天花板
肝了4天,我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文
我们都知道外网上有很多优秀的视频教程平台,比如 Coursera 和 deeplearning.ai。尤其是后者,由吴恩达老师与OpenAI、Langchain、LlamaIndex、AutoGen等公司和作者合作,推出了一系列广受好评的LLM教程,如Prompt Engineering、Langchain教程、LlamaIndex教程和AutoGen教程。deeplearning.ai 的课程紧跟时下热点,是大语言模型爱好者和从业者不可或缺的资源。然而,deepleaning.ai 的课程通常没有中文字幕,这无疑提高了学习的门槛。即使有些同学坚持学习,也可能因为语言障碍只能学到皮毛。我肝了4天,我成功地让这些课程说上流畅地道的普通话。话不多说,让我们直接看看效果视频。
AgenticAI
2025/03/18
2220
肝了4天,我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文
Windows电脑本地安装ChatTTS结合内网穿透实现远程文本转语音
本篇文章主要介绍如何快速地在Windows系统电脑中本地部署ChatTTS开源文本转语音项目,并且我们还可以结合Cpolar内网穿透工具创建公网地址,随时随地远程访问本地搭建的ChatTTS AI语音合成模型。
YIN_尹
2024/09/06
2430
Windows电脑本地安装ChatTTS结合内网穿透实现远程文本转语音
ChatTTS的爆火是必然,它正在重新定义我们与机器对话的方式
当AI技术与语音合成相遇,开源技术众多,为什么 ChatTTS 能够一夜爆火?你有听说过能说情感真切文字的 AI 吗?
Python兴趣圈
2024/06/17
8440
ChatTTS的爆火是必然,它正在重新定义我们与机器对话的方式
虚拟主播必备:使用ChatTTS打造接近真实人类的AI虚拟角色声音
各位开发者小伙伴们!今天我要给大家推荐一个超级火的AI项目——ChatTTS。这个开源文本转语音(TTS)项目的火爆程度简直让人难以置信,在短短一周内就获得了20k星,并且在GitHub上已经突破了21k星!是不是很激动?别急,接下来我会手把手教你如何快速在Windows系统电脑中本地部署ChatTTS。不仅如此,我们还会通过Cpolar内网穿透工具创建公网地址,让你随时随地都能远程访问你的AI语音合成模型。
FGGIT
2025/01/09
5420
虚拟主播必备:使用ChatTTS打造接近真实人类的AI虚拟角色声音
【人工智能】Transformers之Pipeline(三):文本转音频(text-to-audio/text-to-speech)
pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks),共计覆盖32万个模型。
LDG_AGI
2024/08/13
4430
【人工智能】Transformers之Pipeline(三):文本转音频(text-to-audio/text-to-speech)
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
大家好,我是星哥,今天给大家介绍两款声音克隆、文本转语音的软件,一个是ChatTTS和Spark-TTS,并且都有一键安装包,让你无需复杂的配置,就能在本地轻松体验声音的魅力。
星哥玩云
2025/04/02
1.5K0
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
【AIGC部署实践系列教程 #3】HAI 一键部署爆火开源语音项目ChatTTS
TTS 是 “Text-to-Speech” 的缩写,中文意思是“文本到语音”。简单来说,TTS 是一种技术,它能够将文字信息转换成人类的语音,计算机或智能设备就能够"说话"了。TTS 技术通过模仿人类的语音特征,使得合成的语音听起来尽可能自然流畅。随着技术的发展,已经能够模拟不同的语调、情感,甚至特定人的声音,让语音交互更加人性化和个性化。
腾讯云计算产品团队
2024/06/13
6100
【AIGC部署实践系列教程 #3】HAI 一键部署爆火开源语音项目ChatTTS
在MoneyPrinterPlus中使用本地chatTTS语音模型
之前MoneyPrinterPlus在批量混剪,一键AI生成视频这些功能上的语音合成功能都用的是云厂商的语音服务,比阿里云,腾讯云和微软云。
程序那些事
2024/07/16
4120
在MoneyPrinterPlus中使用本地chatTTS语音模型
腾讯云语音合成TTS试用
随着人工智能技术的飞速发展,人机交互的方式也在不断革新。腾讯云语音合成(TTS)技术,作为AI领域的一项重要应用,正在以前所未有的速度改变我们的生活和工作方式。大家好,我是AI大眼萌,今天就让我们一起探索这项技术的魅力和潜力!
AI大眼萌
2024/06/30
2.3K0
腾讯云语音合成TTS试用
HAI一键启动chattts,最逼真的开源语音合成模型
今天给大家带来国内团队制作的,效果最逼真的开源语音生成模型chattts,即开即用
geru
2024/06/04
8141
HAI一键启动chattts,最逼真的开源语音合成模型
【AI落地应用实战】文本生成语音Parler-TTS + DAMODEL复现指南
这里我要推荐的【好事】文章是如何从零构建一个现代深度学习框架,2024年可以说是大模型发展迅速的一年,国内的国际的各大厂商都推出了多种场景的大模型,那么作为小白,虽然不是大模型从业者,但是也想了解一下大模型这样的深度学习框架到底是怎么来的,是如何构建的呢?可以看这篇文章:
中杯可乐多加冰
2024/11/12
6250
一键体验自然流畅的ChatTTS语音合成,ChatTTS突破开源语音天花板
最近,一个名为 ChatTTS 的文本转语音项目突然火了起来,吸引了大家的广泛关注。
一个程序猿的异常
2024/06/17
8570
一键体验自然流畅的ChatTTS语音合成,ChatTTS突破开源语音天花板
ChatTTS webUI & API:ChatTTS本地网页界面的高效文本转语音、同时支持API调用!
Github:https://github.com/jianchang512/ChatTTS-ui
AI进修生
2024/12/02
1.8K0
ChatTTS webUI & API:ChatTTS本地网页界面的高效文本转语音、同时支持API调用!
开源免费 AI 朗读中文,居然也能以假乱真了?
这几天,有个 文本转语音的 Github repo 刷屏了,名字叫做 ChatTTS。
王树义
2024/06/13
4170
开源免费 AI 朗读中文,居然也能以假乱真了?
声临其境!当ChatTTS遇上腾讯云HAI,定制你的专属智能语音服务
「语音」作为人工智能的「启蒙钥匙」,不仅率先踏出实验室大门,步入寻常百姓家,也成为了人类与AI初次触电的「桥接技术」。初期,智能语音技术的研究重心落在了语音识别领域,致力于使机器具备理解人类语言的能力。
zhouzhou的奇妙编程
2024/06/05
1.2K3
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
对此,Canopy Labs的开源开发者Elias表示Orpheus就像人类一样,已经拥有共情能力,能从文本中产生潜在的线索,比如叹息、欢笑和嗤笑。
新智元
2025/04/16
1910
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
VALL-E vs. Spark-TTS:两代零样本 TTS 模型横评
零样本文本转语音(Zero-Shot TTS)技术近年出现突破。微软于 2023 年发布的 VALL-E 模型仅需 3 秒语音示例便可克隆说话人声音,刷新业界对数据门槛的认知。随后开源的 Spark-TTS 进一步在更小模型上实现了近似甚至更优的效果(Ai Voice Cloning-以3秒音频就可克隆著称的网站就是宣称在此模型基础上自研),并原生支持多语言与细粒度可控。作为一名语音 AI 开发者,我将从架构原理、音质保真、推理效率、训练成本与实现复杂度五个维度,客观比较这两代代表性模型,探讨它们在语音克隆发展中的阶段性定位。
用户11657403
2025/05/14
3130
推荐阅读
分享一款可用于对话场景的文本转语音免费工具
5370
6k Star!ChatTTS:开源领域最强的文本到语音转换(TTS)模型!
7060
【机器学习】ChatTTS:开源文本转语音(text-to-speech)大模型天花板
1.5K0
肝了4天,我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文
2220
Windows电脑本地安装ChatTTS结合内网穿透实现远程文本转语音
2430
ChatTTS的爆火是必然,它正在重新定义我们与机器对话的方式
8440
虚拟主播必备:使用ChatTTS打造接近真实人类的AI虚拟角色声音
5420
【人工智能】Transformers之Pipeline(三):文本转音频(text-to-audio/text-to-speech)
4430
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
1.5K0
【AIGC部署实践系列教程 #3】HAI 一键部署爆火开源语音项目ChatTTS
6100
在MoneyPrinterPlus中使用本地chatTTS语音模型
4120
腾讯云语音合成TTS试用
2.3K0
HAI一键启动chattts,最逼真的开源语音合成模型
8141
【AI落地应用实战】文本生成语音Parler-TTS + DAMODEL复现指南
6250
一键体验自然流畅的ChatTTS语音合成,ChatTTS突破开源语音天花板
8570
ChatTTS webUI & API:ChatTTS本地网页界面的高效文本转语音、同时支持API调用!
1.8K0
开源免费 AI 朗读中文,居然也能以假乱真了?
4170
声临其境!当ChatTTS遇上腾讯云HAI,定制你的专属智能语音服务
1.2K3
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
1910
VALL-E vs. Spark-TTS:两代零样本 TTS 模型横评
3130
相关推荐
分享一款可用于对话场景的文本转语音免费工具
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档