首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >还在花钱转语音?10,000+ star 开源「ebook2audiobook」白嫖1107种语言!免费文字秒变多语言音频!

还在花钱转语音?10,000+ star 开源「ebook2audiobook」白嫖1107种语言!免费文字秒变多语言音频!

原创
作者头像
小华同学ai
发布2025-07-24 14:25:59
发布2025-07-24 14:25:59
22600
代码可运行
举报
运行总次数:0
代码可运行

嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!

ebook2audiobook 是一款由 Drew Thomasson 主导、13 k+ Stars(约 9683 ⭐)的开源利器,可实现电子书 (EPUB、PDF、MOBI、TXT…) → 有声书 (.m4b/.mp3) 的无缝转换,支持章节保留、元数据写入、1107+ 语言、TTS 引擎切换、语音克隆等高阶功能

痛点场景

  • 阅读疲劳:长时间盯屏眼睛痛,换成听书更轻松。
  • 通勤学习:早晚地铁公交,想把书“听”下去。
  • 语言学习:多语言版本支持,让听力训练更便捷。
  • 个人品牌:内容创作者可用自定义语音输出品牌专属“播报腔”。

核心功能

功能

描述

优势

章节拆分

自动识别 ebook 章节并生成对应音频片段

导航清晰,支持 m4b 弹跳

多 TTS 引擎支持

XTTSv2、Bark、Fairseq、Piper、Tacotron2、YourTTS 等

可根据语言及场景选最优模型

1107+ 语言

包括中文、阿拉伯语、日语、韩语…

语言覆盖全面

可选语音克隆

输入个人音频即可克隆声音

个性化定制,品牌调性更统一

轻量资源占用

最低 4 GB 内存即可运行

低门槛部署

Web GUI 支持

Gradio 基础的可视化操作界面

简单易用,零命令迷茫

Docker 容器部署

支持容器化、本地/云端快速部署

一键运行,无需环境配置

元数据 & 格式输出

支持 .m4b、.mp3,写入封面、章节、作者等信息

专业听书体验

Colab / HF Spaces 等

支持免费资源运行与演示

云端体验快人一步

技术架构

  • 预处理:Calibre 抽取文本并自动分章;
  • 合成层:用户选择 TTS 引擎,可选个人语音;
  • 生成阶段:Coqui‑TTS 等生成音频,FFmpeg 合并并写入 metadata;
  • 工程优势:4 GB 起即可部署,支持 CPU/GPU,以及本地或容器化部署 。

界面展示

  1. 主界面上传区:一键上传 ebook/声音文件,选择模型、语言与音量等参数;
  2. 参数调节区域:Temperature、Length Penalty、Speed、Top‑k 等滑条可视化调整;
  3. 进度条 & 播放区:实时显示合成进度,可试听或下载音频;
  4. 语言下拉菜单:1107+ 语言任你选,满足多语场景需求。

使用示例

一、Web GUI 使用方法

代码语言:javascript
代码运行次数:0
运行
复制
git clone https://github.com/DrewThomasson/ebook2audiobook
cd ebook2audiobook
pip install -r requirements.txt
python app.py
# 浏览器打开提示的地址,上传 ebook,选择语言 + 模型,点击 “Convert”

二、命令行(无界面运行)

代码语言:javascript
代码运行次数:0
运行
复制
python app.py \
  --headless \
  --ebook path/to/book.epub \
  --language zh-cn \
  --tts_engine XTTSv2 \
  --output_format m4b

三、Docker 部署

代码语言:javascript
代码运行次数:0
运行
复制
docker run -it --rm -p 7861:7861 drewthomasson/ebook2audiobook:latest
# 打开浏览器访问 http://localhost:7861

四、语音克隆实战

  • Step1:录一段你自己的语音:myvoice.wav
  • Step2:命令运行:
代码语言:javascript
代码运行次数:0
运行
复制
python app.py \
  --ebook mybook.pdf \
  --voice myvoice.wav \
  --language en \
  --tts_engine YOURTTS

生成个性化听书,品牌调性突出。

应用场景

  • 上班族/学生:通勤时听电子书,缓解眼疲劳;
  • 语言学习者:反复听目标语言版本,提高语感;
  • 内容创作者:制作有声版文章,用自定义声音输出;
  • 视障人士:将生活必读材料转为听书,增进信息获取;
  • 知识付费补充:文字教学课稿自动朗读,省时省力。

同类项目

项目

语言数

GUI 支持

语音克隆

依赖资源

优势

ebook2audiobook

1107+

✅ Gradio/Docker

Calibre + TTS + FFmpeg

功能最齐全、支持语音克隆、轻量资源

ebook2audiobookSTYLETTS2

~30+

StyleTTS2

架构更聚焦,语音更自然

ebook2audiobook‑piper‑tts

多语支持

✅ Docker

Piper + Calibre

安装简单,偏基础

其他如 storybook TTS 工具

少量语言

各不相同

门槛低,但功能逊色

总结

ebook2audiobook 是目前开源界最强、语言支持最全、功能最丰富的电子书 to 有声书转换工具。低门槛部署、高度可定制、适合多场景使用。无论是自用听书,还是内容创作转音频,它都能解放你的双眼、释放你的时间。

项目地址

https://github.com/DrewThomasson/ebook2audiobook

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 痛点场景
  • 核心功能
  • 技术架构
  • 界面展示
  • 使用示例
    • 一、Web GUI 使用方法
    • 二、命令行(无界面运行)
    • 三、Docker 部署
    • 四、语音克隆实战
  • 应用场景
  • 同类项目
  • 总结
  • 项目地址
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档