首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

让汪峰唱李健的歌?!一款开源的AI声音工具

今年大家看到AI在音乐合成和翻译等惊艳的表现!

但是,很多AI工具和模型都不是开源的。今天给大家介绍一个开源的AI工具:Amphion

它是一个用于音频、音乐和语音生成的工具包,它目标是提供一个平台来研究任何输入到音频的转换。Amphion 旨在支持单独的生成任务,包括但不限于

今天给大家介绍的是它的歌声转换功能,可以让不同的喜欢的歌手演唱任意歌曲!最重要的是,这个工具目前是开源

我们先看一波官方示例

如果觉得示例看着不直接,可以自己去在线体验网址试一试!

(体验网址见文末)

技术上如何实现的?

歌声转换(SVC)是一种使任意歌手能够演唱任意歌曲的技术。

传统的 AI 歌手训练方法主要依赖音频特征,而忽视了文本和标签等其他内容特征。这导致 AI 歌手在演唱时可能会出现发音不准、感情表达不到位等问题。

这个项目调查了三种不同的内容特征,分别来自WeNet、Whisper和ContentVec。让他们在SVC中的互补作用。研究成果表明,多维度内容特征能够有效地提升 AI 歌手的表现。在实验中,使用多维度内容特征训练的 AI 歌手在发音准确度、情感表达等方面均优于使用单一音频特征训练的 AI 歌手。

体验网址:

https://huggingface.co/spaces/amphion/singing_voice_conversion

项目地址:

https://www.zhangxueyao.com/data/MultipleContentsSVC/index.html

代码地址:

https://github.com/open-mmlab/Amphion/tree/main

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OL-eYjE8jCSqw_x1OSmqcTUA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券