我们用3个星期的时间整理了Music alignment和transcription的15篇文献。相关的方法是probablistic model和deep learning。今天把这些链接汇总一下:
Music alignment probabilistic model:
Music transcription probabilistic model:
Music transcription deep learning:
关于deep learning的我觉得比较重要的文献都在这里了。其他方法比如NMF, PLCA请看这个tutorial:
关于alignment和transcription的还有其他的一些新研究,
Alignment比如
Computational Methods for the Alignment and Score-Informed Transcription of Piano Music
比如用专门做post-processing, language model的:
(1) A study on LSTM networks for polyphonic music sequence modelling
(2) Polyphonic Music Sequence Transduction with Meter-Constrained LSTM Networks
再比如用多个网络模型层层叠加的:
Polyphonic Pitch Tracking with Deep Layered Learning
由于一些不可知的原因,就不review了。
看了这些文献后,给我的感觉是大部分的新研究(deep learning)集中于钢琴,可能是因为又MAPS这个数据库。钢琴好弄的地方可能在于每个音符没有什么装饰音,难做的地方在于它是polyphonic。如果换成人声或是不同乐器合奏的polyphonic可能就没有这么好弄了,看到这两篇:
(1)R. Schramm, A. McLeod, M. Steedman, and E. Benetos, "Multi-pitch detection and voice assignment for a capella recording of multiple singers", 18th International Society for Music Information Retrieval Conference, pp. 552-559, Oct. 2017.
(2)E. Benetos, "Polyphonic note and instrument tracking using linear dynamical systems", in Proc. 2017 AES International Conference on Semantic Audio, June 2017.
但是用的不是deep learning的方法。可能大家还不清楚怎么用deep learning在学习音符的同时也能把不同的乐器分开。有想做的朋友可以试试这个思路,用多个objectives同时学,一个学onset, 一个学pitch,一个学乐器分离。要是真做出来了,请我吃饭。
领取专属 10元无门槛券
私享最新 技术干货