在听各种各样的音乐的时候,我想你一定和我一样曾经有过这样好奇的想法:
如果把一个交响乐团演奏曲目里的小提琴部分单拎出来听,会是什么样的感觉?中国有嘻哈的说唱没有伴奏的话,还会那么炫酷吗?如果二重奏的大提琴单飞了,单独演奏曲目还会一样动听吗?
可惜的是,目前还没有能办到从音轨中分离属于不同乐器的音频的软件。原因是一段音频一旦合并到一个轨道上,它的频段就是混合的,包括各种乐器和人声在内的音频频段已经全部重合。而我们听到的音乐或唱片各音轨通常已经通过合并,所以也就没有办法用软件进行分离。
就像如果两个Photoshop图层经过正片叠底,输出JPG文件后,再想把JPG文件的两个图层分离出来,几乎是不可能的事情。
不过最近,麻省理工学院计算机科学与人工智能实验室的研究人员又研究出了一项“黑科技”:他们创建了一个应用程序,可以将特定的乐器演奏的音乐单独从一段合奏乐曲的视频中分离出来。
这个智能软件利用了神经网络深度学习系统来识别跟特定声音频率相联系的像素区域,然后通过对不同区域的分辨来分离出不同的音轨。
神经网络深度学习系统分析了超过60个小时的演奏家演奏的视频,然后目前能够自动辨认超过20种乐器,然后从音频中把这样乐器的音轨分离出来。我们所要做的只是在音频界面点击我们想听的那种乐曲,然后软件就会播放这种乐器的演奏声音。
官方给出了三段合奏视频的演示,分别是吉他小提琴合奏、大号小号合奏以及黑管和吉他合奏。先来感受一下这项黑科技的强大:
我们可以看到在三段视频里面,MIT扔哦更智能的音轨分离的效果还是非常出色的,虽然某些乐器的分离音轨偶有杂音,但对于小提琴这样音色比较明显的乐器来说,总体分离的水平已经非常不错。
实验室的研究人员希望在不久以后能够提高分离出来的音频的质量、增加音频中的乐器数量以及类型,让这个人工智能软件能够在分离音轨方面展示出更加强大的功能。将来即使是同一个“家族”的乐器,比如弦乐器里面的小提琴、中提琴、大提琴以及低音提琴,这个软件也会逐步学习辨识它们的音色差别。
这项研究将来可以应用在混音或者重新灌录旧唱片上,即使是以前录制的母带丢失了也没有关系。
有人就提出,既然这个软件的分离拼接技术这么强大,那么它或者能成为一个很好的混音DJ?不过MIT并不想将这个软件应用在这一点上,他们只是觉得DJ们应该很想拥有这个可以将想要的乐器音频从一段音乐里挑出来放进自己的混音里的黑科技。
本文编译自:https://gizmodo.com/mits-new-ai-powered-software-can-extract-individual-ins-1827372032
-End-
编辑/Zhilin
本文章图片来源于网络
转载文章请标注出处
想要了解更多人工智能领域的资讯、行业动态,欢迎关注声学在线公众号(ID:soundonline)!
加入声学在线:hr@soundonline.org
领取专属 10元无门槛券
私享最新 技术干货