走在路上听到好听的歌,不知道歌名是什么?
Shazam it!
从 Shazam、Soundhound 专有,到现在各大音乐软件标配,听歌识曲的原理是什么?
点击下方视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!
图文版本送给不方便打开的朋友 (°u°)」
拿出手机,录制片段,
找到感兴趣的音乐,就是这么简单。
不过,背后的原理是怎样的?
想通过片段寻找对应的音乐,总共分两步——
第一步,提取片段的特征。过去人们曾尝试,将音高的变化作为检索基础,效果并不理想。后来人们选择将音乐转换为频谱图,每隔几十毫秒提取一次标志点(Landmark)的特征,并将这种特征称为「指纹」。
第二步,匹配。
只要找到同样「指纹」串片段,就能确定目标。
不过资料库中的歌曲成千上万,该如何比对?
答案是……为音乐建立一个「搜索引擎」!歌曲是「网页」,指纹是「关键词」,在含有关键词的歌曲中找到最相似的那首,就完成了「听歌识曲」的过程。
(关于搜索引擎可由此复习:
《搜索引擎是如何工作的?》
)
无论通过哼唱还是通过片段寻找目标歌曲,通通都属于「音乐信息检索」(Music Information Retrieval ,MIR)的范畴。
除了听歌识曲,音乐推荐系统、音乐生成、音乐自动分类等等都属于这一领域,感兴趣的话不妨多了解一下吧!
「知智一分钟」是由「KnowingAI知智」推出的,以人工智能基础知识为主的短视频栏目。
每次一分钟,轻松了解 AI 领域基础概念!
「知智一分钟」现已入驻 B 站,
欢迎投硬币投香蕉发弹幕吐槽我们!
领取专属 10元无门槛券
私享最新 技术干货