前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Suno公司开源的文生语音工具Bark,让你秒变音乐人

Suno公司开源的文生语音工具Bark,让你秒变音乐人

原创
作者头像
算法一只狗
发布2024-09-28 14:43:28
发布2024-09-28 14:43:28
4940
举报
文章被收录于专栏:算法一只狗算法一只狗

最近几天,一直在被Suno生成的AI声音刷屏了,它本质上就是利用AI算法学习大量的音乐作品,然后根据用户输入的提示词重新生成新的音乐。

目前的最新版本已经发布了V3,这个版本在前一版本的基础上增加了更多的音乐风格和流派,同时加强了对提示词的依从性,减少了幻觉问题。其优点在于:

  • 不需要学习任何乐理知识,就可以创作属于自己的音乐
  • 支持更多样化的风格和流派
  • 基于生成的音乐可以不断进行调整,直到自己满意为止

目前Suno官网全球免费可用,也不用挂梯子,只要你有一个谷歌账号,立马变身成音乐达人,在1分钟内就可以创作自己的音乐。

怎么创作

打开官方网页,直接用谷歌账号进行登陆:

登陆之后可以看到“Explore”页面,可以在这个页面上探索别人分享出来的音乐。

或者觉得不错的音乐,可以点赞和分享都可以,并且可以在别人的基础上重新继续制作,相当于免费白嫖了一个好听的音乐idea了:

具体的创作方法也比较简单,有两种主要的创作方式:

  • 填入歌词创作:也就是根据你自己填入的词语进行生成
  • 单独生成纯音乐

这里我用周杰伦《晴天》的歌词,利用GPT-4转换成粤语版本:

然后按照suno的形式进行转换,填入歌曲类型后,只需要等待一两分钟,音乐就生成好了

可以看看我生成的效果:

Suno的原生技术Bark可本地部署

在次之前,suno公司其实已经在GitHub上发布了自己第一代的文生语音的技术:Bark

https://github.com/suno-ai/bark#center

这个项目,也可以直接在colab平台上免费白嫖运行

其中包含了几个重要的功能

文字转语音

Bark目前已经支持各种语言,并自动根据输入文本确定语言。当提示使用代码转换文本时,Bark 将尝试使用相应语言的本地口音。目前英语口音是质量最好的。

比如输入下面语言:

可以直接生成对应的语音:

!videosuno-ai_bark- 🔊 Text-Prompted Generative Audio Model.mp4

文字转音乐

Bark 可以生成所有类型的音频,只需要在输入文字的时候加入音乐字符

模仿口音加入笑声

最为逆天的是,在给定的提示词下,它能够模仿真实人类的口语。像是让生成的语音加入笑声也是手到擒来。

总结

Suno V3版本的出现,使得普通人能够立刻上手创作音乐。而其背后的模型Bark可以做的事情更多,比如:

  • 创建多种语言的播客和有声读物#center
  • 为游戏、电影进行配音
  • 可以针对有语言障碍的人开发辅助发声工具

当然不仅仅上面的场景,只要你能想到的都可以做出来。

以上就是本期的所有内容了,我是leo,我们下期再见

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 怎么创作
  • Suno的原生技术Bark可本地部署
    • 文字转语音
    • 文字转音乐
    • 模仿口音加入笑声
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档