前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯音乐天琴实验室 | 针对K歌场景的端到端修音系统

腾讯音乐天琴实验室 | 针对K歌场景的端到端修音系统

作者头像
一点人工一点智能
修改于 2022-12-28 07:26:37
修改于 2022-12-28 07:26:37
1.1K0
举报

一年一度的全球语音大会INTERSPEECH 2022论文评选结果已经揭晓,腾讯音乐天琴实验室被录取两篇论文,本文介绍第一篇:《KaraTuner: Towards end to end natural pitch correction for singing voice in karaoke》

KaraTuner: Towards end to end natural pitch correction for singing voice in karaoke

作者:Xiaobin Zhuang, Huiran Yu, Weifeng Zhao, Tao Jiang, Peng Hu

01 主要创新点

智能修音系统通常包括几个阶段:基音提取、偏差估计、基频偏移处理和交叉淡入平滑。经典的基于规则的修音策略不但需要有音乐领域的专业知识,而且设计的规则很难涵盖绝大部分的修音情况,会造成在某些情况下修出怪音的问题。

在本文中,我们提出了首个基于曲谱的端到端修音方案KaraTuner,先在曲谱的指导下预测出修正后的音高曲线,然后结合从原始录音中提取的频谱包络,通过基频可控的歌声声码器重新合成歌唱声音,实现自动修音。

KaraTuner中引入了几个关键技术点,以确保音高精度、音高自然度、音色一致性和音质。在基频预测器中,采用了基于Transformer的前馈网络来捕获频谱包络和音符的相关性,同时也设计了一种基于源-滤波器模块和Fre-GAN结构相结合的基频可控歌声声码器,确保修音后的音质。KaraTuner通过A/B测试获得了比基于规则的基频校正方法更高的偏好,感知实验也表明,与传统World声码器、Phase Vocoder以及神经网络声码器CLPCNet相比 ,KaraTuner在音色一致性和音质方面具有显著优势。

02 论文方法

1)在修音任务中,几乎不存在来自同一个非专业用户的的修音前后的数据,这也为设计端到端修音系统增加了难度。

本文的新颖之处在于我们使用HMM平滑对跑调的人声提取标准 MIDI 音符序列作为训练数据中的参考模板。在训练阶段,我们从跑调的参考音符模板学习生成用户跑调的音高曲线。在推理阶段,我们使用准确的参考音符模板替换跑调的音符模板。通过这种方法,我们构建了一个大型的数据集,无需手动标记完成音高预测任务。在实验中也发现,频谱包络特征仍然隐含地包含音高曲线的信息,因此将频谱包络和参考音符结合进行基频预测,不但可以确保音调修正,还能保留原始歌声中的更多的基频曲线细节。

图1:基频预测方法
图1:基频预测方法

2)源-滤波器 (SF) 模块的输入是音高曲线和频谱包络。

在训练阶段,真实音高直接接入SF块,而在推理阶段,预测音高通过嵌入层并与频谱包络生成周期性分量,频谱包络也通过 ResBlock2 预测非周期分量。一种简单的组合方式是将周期性分量和非周期性分量直接等比例相加,但是我们发现每帧信号通过可学习的权重参数来控制混合比例,可以显著提高合成音频的音质,减少频谱缺陷。因此,每一帧信号r可以隐式表示为:

r = σ(f1(sp)) ⊗ emb(pitch) ⊗ sp + f2(sp)

在生成器中,采用 HiFi-GAN 中提出的多感受野融合 (MRF) 模块和 Fre-GAN 中的两个鉴别器,并调整了部分参数,将音频采样率提升到32kHz。整体的模型结构如图所示:

图2:端到端自动修音框架
图2:端到端自动修音框架

03 实验分析

我们收集了 5294 首不同演唱水平的业余用户的歌唱数据,平均每首歌4.3分钟。在效果评估方面,我们先对音高自然度、坏点数进行了A/B测试。在测试集上,KaraTuner相比于基于规则的方法有更好的自然度。我们也把Phase Vocoder、WORLD 声码器和 CLPCNet 作为基线系统,对音色一致性、音频质量和整体质量进行MOS分评估,打分结果也表明KaraTuner在音质和整体质量上都取得了最高的 MOS 分数。而在实验中我们也发现了,DSP 声码器比神经网络声码器对音高的还原能力更强,且对于低音质的音频鲁棒性更强,这也是KaraTuner后续可以结合改进一个方向。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一点人工一点智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
React Native在美团外卖客户端的实践
美团研发团队基于React Native开源框架,并结合美团业务场景,定制化开发了一套动态化方案。本文主要分享该动态化方案在美团外卖业务场景中的实践,希望能给大家一些启发。
美团技术团队
2019/12/23
2.3K0
React Native在美团外卖客户端的实践
美团智能支付稳定性测试实战
本文介绍了美团智能支付业务在稳定性方向遇到的挑战,并重点介绍QA在稳定性测试中的一些方法与实践。
美团技术团队
2019/01/09
1.4K0
美团配送实时特征平台建设实践
导读:2019年5月,美团正式推出新品牌「美团配送」,升级配送开放平台。那你知道支撑美团配送大脑的实时特征平台是如何建设的吗?如何实现每分钟生产千万级的实时特征?如何在70w+QPS的场景下实现4个9响应耗时在50毫秒的需求?本文将为大家介绍配送实时特征平台的发展历程,关键技术和实践经验。
Houye
2021/01/27
1.5K0
美团配送实时特征平台建设实践
系统总出故障怎么办,或许你该学学稳定性建设!
说到系统稳定性,不知道大家会想起什么?我想大多数人会觉得这个词挺虚的,不知道系统稳定性指的是什么。一年前的我看到这个词,也是类似于这样的感受,大概只知道要消除单点、做好监控报警,但却并没有一个体系化的方法论。经过一段时间的摸索,我对系统稳定性有了较为体系化的认识,于是迫不及待地希望和大家一起分享。所以今天,就让我跟大家简单聊聊系统稳定性建设这个话题吧!
陈树义
2022/09/08
8340
系统总出故障怎么办,或许你该学学稳定性建设!
美团高性能终端实时日志系统建设实践
你是否经常遇到线上需要日志排查问题但迟迟联系不上用户上报日志的情况?或者是否经常陷入由于存储空间不足而导致日志写不进去的囧境?本文介绍了美团是如何从0到1搭建高性能终端实时日志系统,从此彻底解决日志丢失和写满问题的。希望能为大家带来一些帮助和启发。
美团技术团队
2022/12/16
9560
美团高性能终端实时日志系统建设实践
美团外卖自动化业务运维系统——Alfred
背景 美团外卖业务在互联网行业是非常独特的,不仅流程复杂——从用户下单、商家接单到配送员接单、交付,而且压力和流量在午、晚高峰时段非常集中。同时,外卖业务的增长非常迅猛,自2013年11月上线到最近峰
美团技术团队
2018/03/13
1.9K0
美团外卖自动化业务运维系统——Alfred
美团外卖订单中心的演进 转
美团外卖从2013年9月成交第一单以来,已走过了三个年头。期间,业务飞速发展,美团外卖由日均几单发展为日均500万单(9月11日已突破600万)的大型O2O互联网外卖服务平台。平台支持的品类也由最初外卖单品拓展为全品类。
chinotan
2019/04/03
1.1K0
美团即时物流的分布式系统架构设计
本文根据美团资深技术专家宋斌在ArchSummit架构师峰会上的演讲整理而成,主要介绍在美团即时物流分布式系统架构逐层演变的进展中,遇到的技术障碍和挑战,还有我们的解决思路。
美团技术团队
2019/01/07
1.1K0
美团点评智能支付核心交易系统的可用性实践
每个系统都有它最核心的指标。比如在收单领域:进件系统第一重要的是保证入件准确,第二重要的是保证上单效率。清结算系统第一重要的是保证准确打款,第二重要的是保证及时打款。我们负责的系统是美团点评智能支付的核心链路,承担着智能支付100%的流量,内部习惯称为核心交易。因为涉及美团点评所有线下交易商家、用户之间的资金流转,对于核心交易来说:第一重要的是稳定性,第二重要的还是稳定性。
静儿
2018/05/24
2.7K4
美团即时物流的分布式系统架构设计
美团外卖已经发展了五年,即时物流探索也经历了3年多的时间,业务从零孵化到初具规模,在整个过程中积累了一些分布式高并发系统的建设经验。最主要的收获包括两点:
美团技术团队
2018/11/23
1.5K0
美团即时物流的分布式系统架构设计
大神分享美团外卖订单中心演进之路
作者:何轼 来源: http://tech.meituan.com/mt_waimai_order_evolution.html 前言 美团外卖从2013年9月成交首单以来,已走过了三个年头。时期,事
小小科
2018/05/04
2.9K1
大神分享美团外卖订单中心演进之路
智能支付稳定性测试实战
美团支付承载了美团全部的交易流量,按照使用场景可以将其分为线上支付和智能支付两类业务。线上支付,支撑用户线上消费场景,处理美团所有线上交易,为团购、外卖、酒店旅游等业务线提供支付能力;智能支付,支撑用户到店消费场景,处理美团所有线下交易,通过智能POS、二维码支付、盒子支付等方式,为商家提供高效、智能化的收银解决方案。其中,智能支付作为新扩展的业务场景,去年也成为了美团增速最快的业务之一。
美团技术团队
2018/12/14
1.1K0
智能支付稳定性测试实战
美团外卖持续交付的前世今生
美团外卖自2013年创建以来,业务一直在高速发展,从早期单一的美食业务发展成为包含闪购、跑腿、闪付、营销、广告等在内的平台业务。每个业务团队虽然都有不同的业务形态,但是几乎都有相同的诉求:需求能不能尽快的上线?本文将从外卖的历史实践中,浅谈一个好的持续交付需要综合考虑哪些关键因素,希望对大家有所帮助或启发。
美团技术团队
2020/02/19
1.6K0
美团外卖持续交付的前世今生
美团即时物流的分布式系统架构设计
美团外卖已经发展了五年,即时物流探索也经历了3年多的时间,业务从零孵化到初具规模,在整个过程中积累了一些分布式高并发系统的建设经验。最主要的收获包括两点:
物流IT圈
2019/07/16
1K0
美团即时物流的分布式系统架构设计
万字详解高可用架构设计
系统高可用是一个宏大的命题,从设计思想、架构原则到工程能力、服务管理等等方方面面,每个视角单拆出来都不是一篇文章可以解决的。本文将从大局上全面系统地梳理高可用系统架构,起到一个提纲挈领的作用。
腾讯云开发者
2025/01/07
3.1K0
万字详解高可用架构设计
美团大规模微服务通信框架及治理体系OCTO核心组件开源
微服务通信框架及治理平台OCTO作为美团基础架构设施的重要组成部分,目前已广泛应用于公司技术线,稳定承载上万应用、日均支撑千亿级的调用。业务基于OCTO提供的标准化技术方案,能够轻松实现服务注册/发现、负载均衡、容错处理、降级熔断、灰度发布、调用数据可视化等服务治理功能。
美团技术团队
2019/08/15
1.2K0
美团大规模微服务通信框架及治理体系OCTO核心组件开源
全链路压测平台(Quake)在美团中的实践
在美团的价值观中,“以客户为中心”被放在一个非常重要的位置,所以我们对服务出现故障越来越不能容忍。特别是公司业务正处在高速增长的阶段,每一次故障对公司来说都是一笔不小的损失。而整个IT基础设施非常复杂,包括网络、服务器、操作系统以及应用层面都可能出现问题。在这种背景下,我们必须对服务进行一次全方位的“体检”,从而来保障美团多个业务服务的稳定性,提供优质的用户服务体验。真正通过以下技术手段,来帮助大家吃的更好,生活更好:
美团技术团队
2019/04/04
2.3K0
全链路压测平台(Quake)在美团中的实践
美团外卖广告智能算力的探索与实践(二)
总第506篇 2022年 第023篇 在深度学习时代,算力的需求和消耗日益增长,如何降低算力成本,提高算力效率,逐渐成为一个重要的新课题。智能算力旨在对流量算力进行精细化和个性化分配,从而实现系统算力约束下的业务收益最大化。 本文主要介绍了美团外卖广告智能算力从线性规划算法到进化算法的技术演进过程,给出了一种基于进化算法的多动作算力分配方案,希望能给大家带来一些帮助或者启发。 1 业务背景 2 整体思路 2.1 算力分配问题形式化描述 2.2 挑战分析 3 方案设计 3.1 全链路最优算力决策 3.2 系
美团技术团队
2022/04/29
9980
美团外卖广告智能算力的探索与实践(二)
美团外卖Android Crash治理之路
Crash率是衡量一个App好坏的重要指标之一。如果你忽略了它的存在,它就会得寸进尺,愈演愈烈,最后造成大量用户的流失,进而给公司带来无法估量的损失。本文讲述美团外卖Android客户端团队在将App的Crash率从千分之三做到万分之二过程中所做的大量实践工作,抛砖引玉,希望能够为其他团队提供一些经验和启发。
美团技术团队
2018/08/01
1.2K0
美团外卖Android Crash治理之路
高可用 兜底方案
对于秒杀系统来说,在大流量的迅猛冲击下,都曾经或多或少发生过宕机的情况。当一个系统面临持续的大流量时,它其实很难单靠自身调整来恢复状态,你必须等待流量自然下降或者人为地把流量切走才行,这无疑会严重影响用户的购物体验
BUG弄潮儿
2021/09/10
1.4K0
高可用 兜底方案
推荐阅读
相关推荐
React Native在美团外卖客户端的实践
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档