大家好,这里致力于分享有趣、有用知识的贤弟!
这篇文章简单与大家分享一个在github上开源的AI模仿声音项目——Mocking Bird。
Mocking Bird项目目前获得32.5K的star和5k的Fork,是一个基于AI 拟声开源项目,它能在 5 秒内克隆你的声音并生成任意语音内容,支持中文普通话。
1、Mocking Bird的特点
支持Windows、Mac和Linux系统下使用;
基于B/S架构交互,简单收集声音,便可生成拟场;
支持中文拟音,支持离线使用,不用联网也能进行训练;
2、Mocking Bird的布署
Mocking Bird的布置在readme.me文件中有详细描述,只需要按照说明文档中的步骤,把python环境、PyThorch和多媒体处理组件FF'mpeg安装好,以及依赖库都安装好即可。
一般都可以在安装好python环境好,通过【pip install -r readme.txt】命令,将所有布署所需的依赖包安装好。
布置成功后,可以通过游览器访问8080端口,体验Mocking Bird的效果,具体窗口效果如下:
3、Mocking Bird的使用步骤
首先,输入一段你需要生成语音的中文;然后录制一段说话声音,【也可以从网上找一段说话声音】
接着使用synthesizer选项中的模型进行训练,这时候点击“上传合成“按钮就可以生成你需要模仿的声音了。
【也许,前面几次生成会显得生硬,这时候你可以使用开发者提供的demo_toolbox.py进行调参,轻松可以达到以假乱真的效果。你听合成的语音时,最好是让其他人进行判断,毕竟你心里有了防备,无论听什么都会觉得假。】
项目地址【https://github.com/babysor/MockingBird】
PS:请友善探索项目,不要将之用于歧途!
领取专属 10元无门槛券
私享最新 技术干货