首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

文本生成音乐模型MusicLDM 发布,有效解决版权等问题

品玩8月7日讯,据 Arxiv 页面显示,来自加州大学、蒙特利尔大学等多所高校的研究者近日联合发表论文,介绍了一款名为MusicLDM 的文本生成音乐模型。

该模型利用 Stable Diffusion 和 AudioLDM 架构,通过在音乐数据样本集上重新训练对比性语言-音频预训练模型(CLAP)和Hifi-GAN声码器来实现。为了解决训练数据和版权问题,研究团队提出了两种不同的混合策略:节拍同步音频混合和节拍同步潜在混合,通过重新组合训练音频或通过潜在嵌入空间来生成新的音乐。使生成的音乐更多样化,同时仍忠于相应的风格。

研究显示,MusicLDM 改善了生成音乐的质量和新颖性,以及提示文本和生成音乐之间的关联性。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OX-MvltnjaY4AUWFb_tB8HFA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券