前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >玩转AI新声态-哼歌识曲背后的秘密

玩转AI新声态-哼歌识曲背后的秘密

原创
作者头像
用户11132717
发布于 2024-06-20 09:18:05
发布于 2024-06-20 09:18:05
5270
举报

背景:在当今社会,随着科技的发展,人们对音乐的需求也在不断增加。而哼歌识曲作为一种便捷的音乐识别方式,受到了越来越多人的喜爱。本文将为您揭秘哼歌识曲背后的原理,以及音乐识别技术的发展历程和应用。

人类早期的尝试:

1、早在20世纪60年代,科学家们就开始尝试通过计算机识别音乐。早期的研究主要集中在音频信号的处理和分析上,如频谱分析、音高检测等。然而,由于技术限制,这一时期的音乐识别准确率较低。

2、随着计算机技术的发展,特别是机器学习深度学习技术的兴起,音乐识别领域取得了重大突破。研究者们开始利用这些技术对音乐进行特征提取和分类,大大提高了音乐识别的准确率。以至于现在除了音乐软件外,例如微信的主流APP也引入了哼歌识曲功能

为什么通过哼歌就能识别出来曲目?

其实哼歌识曲主要归功于音频信号处理和机器学习技术:

1、音频信号处理:当用户在音乐软件中哼歌时,软件首先会捕捉到这段音频信号。然后,通过一系列的信号处理技术,如傅里叶变换、梅尔频率倒谱系数(MFCC)等,将音频信号转化为特征向量。这些特征向量能够描述音频的声学属性,如音高、节奏、音色等。

2、机器学习算法:音乐软件通常会使用机器学习算法来训练一个模型,使其能够识别不同歌曲的特征。这些算法可能包括深度学习、卷积神经网络(CNN)等。在训练过程中,模型会学习大量歌曲的特征数据,并建立起一个庞大的数据库

3、哼歌识别:当用户哼歌时,软件会将捕捉到的音频特征与数据库中的歌曲特征进行比对。通过计算相似度,软件能够找到与哼唱音频最匹配的歌曲。这个过程可能涉及到一些优化算法,如动态时间规整(DTW)等,以确保即使在哼唱节奏或音高有所变化的情况下,也能准确识别歌曲。

最后,为了提高识曲的准确性,音乐软件还可能利用用户的交互来优化结果。例如,当软件返回多个候选歌曲时,用户可以选择最符合自己记忆的那一首,从而帮助软件在未来更准确地识别类似的歌曲。

从哼歌->>>到识曲:(经历了哪些步骤)

1、音频采集:用户通过麦克风等设备哼唱歌曲,系统将采集到的声音信号转换为数字信号。

2、预处理:对采集到的音频数据进行降噪、去噪等预处理操作,以提高音频质量。

3、特征提取:从预处理后的音频数据中提取出关键特征,如旋律、节奏、音色等。

4、音乐匹配:将提取出的特征与数据库中的音乐作品进行比对和匹配。

5、结果输出:根据匹配结果,系统输出相应的歌曲信息,如歌曲名称、歌手等。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
音乐识别探索之路|音色识别亮相IJCNN,UAE惊艳ICASSP
一年一度的国际知名会议2021论文评选结果已经相继揭晓,我们的论文《Large-scale singer recognition using deep metric learning: an experimental study》成功被国际神经网络联合大会 (International Joint Conference on Neural Networks,简称IJCNN)收录,《Learning Audio Embeddings with User Listening Data for Content-
QQ音乐技术团队
2021/04/26
5.2K0
一个App卖了4亿美元,这家听声识曲公司为何得到Apple的青睐?
2018 年 9 月,苹果最终以 4 亿美金完成对 Shazam 公司的收购,让不少人为之振奋,在当时对外公布的一份声明中可以看到,自Shazam应用登陆App Store以来,是其最受欢迎的iOS应用之一。
AI科技大本营
2019/05/12
1.3K0
AI听曲识歌!哼曲、口哨吹,都能秒识! ⛵
本文讲解音频检索技术及其广泛的应用场景。以『听曲识歌』为例,技术流程为具对已知歌曲抽取特征并构建特征向量库,而对于待检索的歌曲音频,同样做特征抽取后进行比对和快速匹配。
ShowMeAI
2022/08/26
5.3K0
AI听曲识歌!哼曲、口哨吹,都能秒识! ⛵
下一代听歌识曲技术——从信号处理到深度学习
音乐丰富我们的生活;音乐传达人类的情感;音乐表达人类的艺术。人类文明的进程中离不开音乐这个载体,音乐也离不开人类的真情创作。在听到好听却没听过的歌曲时,如何快速准确得到该歌曲的歌名成为当务之急。LiveVideoStackCon 2022 北京站邀请到了腾讯音乐的孔令城老师,为我们介绍QQ音乐在听歌识曲方面的成熟方案。 文/孔令城 编辑/LiveVideoStack 下午好,我是来自腾讯音乐的孔令城 ,很荣幸能够借助LiveVideoStack平台、代表天琴实验室,与在座的各位专家、大佬分享我们天琴实验室
LiveVideoStack
2023/04/26
2.4K0
下一代听歌识曲技术——从信号处理到深度学习
一个App卖了4亿美元,这家听声识曲公司为何得到Apple的青睐?
2018 年 9 月,苹果最终以 4 亿美金完成对 Shazam 公司的收购,让不少人为之振奋,在当时对外公布的一份声明中可以看到,自Shazam应用登陆App Store以来,是其最受欢迎的iOS应用之一。
AI科技大本营
2019/03/06
1.1K0
一个App卖了4亿美元,这家听声识曲公司为何得到Apple的青睐?
谷歌新功能“哼歌识曲”!找到你脑海里循环播放的那首歌
你是不是也有过这样的体验,在电视上或者商场里听到一首很好听的歌,想搜索它的歌名,当你打开音乐App的“听歌识曲”功能时,要么手机完全录不到歌声,要么已经过了副歌部分,很难识别出来。
大数据文摘
2020/10/30
9.5K0
谷歌新功能“哼歌识曲”!找到你脑海里循环播放的那首歌
音频品鉴与歌唱评价——音频内容理解实践
歌唱评价是K歌系统中核心技术之一。近年来,歌唱评价领域也发生着多元化和深度化的变革。本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江益靓,为大家介绍全民K歌的多维度评价技术和深度歌唱评价技术的实践,以及优质内容挖掘中使用的音频品鉴系统。 文/江益靓 编辑/LiveVideoStack 各位同行朋友们,大家好,很高兴和大家一起分享交流,本次分享的主题是音频品鉴与歌唱评价——音频内容理解的一些技术实践。我是来自天琴实验室的益靓。 接下来将从四个方面展开介绍:歌唱
LiveVideoStack
2023/05/18
1.8K0
音频品鉴与歌唱评价——音频内容理解实践
【机器学习】音乐与AI的交响:机器学习在音乐产业中的应用
在人类文明的长河中,音乐始终扮演着至关重要的角色。它不仅是情感的载体,更是文化的桥梁,跨越时空,连接着不同的人群和时代。然而,随着科技的飞速发展,特别是人工智能技术的崛起,音乐产业正经历着一场前所未有的变革。在这场变革中,机器学习作为人工智能的核心技术之一,正以其独特的魅力和无限的潜力,悄然改变着音乐的创作、分析、推荐以及整个产业的生态格局
Eternity._
2024/11/01
3120
【机器学习】音乐与AI的交响:机器学习在音乐产业中的应用
​K歌中的歌唱评价与嗓音分析
我是高月洁,来自网易云音乐,是K歌综合评分系统的项目负责人,同时也负责包括音乐业务、直播业务与嗓音分析相关的内容。
LiveVideoStack
2022/02/11
3.8K1
​K歌中的歌唱评价与嗓音分析
Python Audio 库 详解
Python 提供了一些强大的音频处理库,可以帮助开发者实现音频分析、编辑、合成、信号处理等功能。这些库能够支持各种音频文件格式,进行音频播放、录制、转换、效果处理、特征提取等操作。下面我们将介绍几个常用的 Python 音频库及其应用。
Michel_Rolle
2024/12/27
2.7K0
Java实现基频曲线分析!
今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一个人虽可以走的更快,但一群人可以走的更远。
喵手
2024/09/19
2250
Java实现基频曲线分析!
基于 Milvus 的音频检索系统
人可以通过听觉感知位置、运动、音调、音量、旋律并获取信息。日常生活中,音频是一种重要的多媒体数据,我们会收听电台节目、欣赏在线音乐等。
Zilliz RDS
2021/03/22
1.5K0
基于 Milvus 的音频检索系统
2019腾讯犀牛鸟精英人才培养计划课题介绍(六)—语音技术
2019年度腾讯“犀牛鸟精英人才培养计划”开放申请中,该项目是一项面向学生的校企联合人才培养项目,为期一年。入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养,并获得3个月以上带薪到访腾讯开展科研的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,全面提升学生综合素质。 今年共有10大方向,81个子课题 申报截止日期:2019年1月28日 同学们,抓紧时间申报哦 下面让我们一起来看看第六个方向吧 语音技术
腾讯高校合作
2019/01/22
1K0
2019腾讯犀牛鸟精英人才培养计划课题介绍(六)—语音技术
论文阅读:《Improving Content-based and Hybrid Music Recommendation using Deep Learning》
https://blog.csdn.net/u011239443/article/details/79984751
小爷毛毛_卓寿杰
2019/02/13
7230
2019腾讯犀牛鸟精英人才培养计划课题介绍(六)—语音技术
精英人才培养计划是一项校企联合人才培养项目,入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养。培养期间,学生将获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,定期举办线上线下交流活动,全面提升学生综合素质。入选学生还将获得线上实名社群平台“十分精英圈”的在线访问权限,结识志同道合的科研伙伴,获取业界信息及资源。 今年共有10大方向,81个子课题 申报截止日期:2019年1
腾讯高校合作
2019/01/08
2.1K0
2019腾讯犀牛鸟精英人才培养计划课题介绍(六)—语音技术
深度学习革新音乐转录
自动音乐转录(AMT)作为音乐信息检索(MIR)的一个重要分支,其目标是将音频信号转换成可读的乐谱形式,这在音乐分析、教育、制作等多个领域都有着广泛的应用。AMT的发展历程可以划分为两个主要阶段:早期基于规则的方法和现代基于深度学习的技术。
Srlua
2024/12/20
1940
深度学习革新音乐转录
抖音「神曲」那么多,字节跳动是如何玩转亿级曲库的?
机器之心发布 机器之心编辑部 在今年的音乐科技顶会 ISMIR 2021(International Society for Music Information Retrieval)上,字节跳动海外技术团队有 7 篇论文入选,涵盖了音乐分类、音乐标签、音源分离、音乐结构分析等多个技术方向。 如今抖音已经成为音乐宣发的一个重要渠道。一支支音乐先在抖音上以短视频 BGM 火起来,再扩散到各大音乐平台上。抖音神曲甚至成了很多音乐平台的一个重要分类。 有人说神曲能火是因为歌词和旋律简单,听得多了就印在脑子里。但是
机器之心
2023/03/29
6300
抖音「神曲」那么多,字节跳动是如何玩转亿级曲库的?
时间序列:18个时间序列特征提取高效方法
时间序列特征提取是数据科学工作流程中的关键环节,能够将原始时间序列数据转化为具有分析价值的特征表示。
皮大大
2025/05/09
3240
今天的【 科技文 】有点污
作者:张大威,TEG 安全平台部。2013年加入安全平台部,从事多媒体信息安全、智能安全领域,目前在色情语音识别和藏维语识别领域,利用深度学习技术构建恶意音视频主动识别过滤体系。 鉴黄小趣事作者:“做视频分类时,有时会忘记控制音量。有次被旁边的组长听到了,他就在部门的大群里面吐槽说他都没法工作了,周围都是“嗯...啊...哦...”的声音,自己都快有反应了。。。这件事被公司的同事笑了好久。” 基于音频指纹的涉黄涉暴视频检测技术前言当今人们在社交软件上发布的视频数以亿计,其中不乏大量的恶意视频,涉及政治、
腾讯技术工程官方号
2018/01/29
1.5K0
今天的【 科技文 】有点污
采用深度学习算法为Spotify做基于内容的音乐推荐
【编者按】本文是比利时根特大学(Ghent University)的Reservoir Lab实验室博士研究生Sander Dieleman所撰写的博客文章,他的研究方向是音乐音频信号分类和推荐的层次表征学习,专攻深度学习和特征学习。 以下为译文: 2014年夏天,我在 网络音乐平台Spotify (纽约)实习, 致力于使用卷积神经网络 (convolutional neural networks)做基于内容的音乐推荐。本文将介绍我使用的方法,并展示一些初步的结果。 概述 这篇文章很长,所以先对各节的内容做
用户1737318
2018/06/05
1.4K0
推荐阅读
相关推荐
音乐识别探索之路|音色识别亮相IJCNN,UAE惊艳ICASSP
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档