让我们假设我有温度,风速,气压,湿度等的局部测量,以时间序列的形式,这就是我从世界上所知道的全部。有时,龙卷风会掠过我的探测器。
因为龙卷风不只是一个随机的东西,有一种模式,训练有素的眼睛可以在时间序列中识别出来…温度、风速等的一些变化以某种方式相互关联,周围有不可预测的波动。
我想以某种自动的方式来识别时间序列中与我的探测器“看到”龙卷风的周期相对应的时间间隔。
哪种机器学习方法更适合识别它们,并给我一些相应的“可靠性系数”。
注意,由于龙卷风是一个本质上不稳定的物体,它以某种不稳定的方式移动,探测器并不总是能看到温度,风速等的变化,因为龙卷风可以在探测器上来回移动,局部改变它的形状等。我想我想说的是,时间序列测量并不符合人们可以在龙卷风的“静止框架”中绘制的这些量的实际空间分布。然而,它总是看到“某种”相同的特征,周围有一些随机性,我的眼睛就能识别出来,这让我认为这是一个适合ML的任务。
其他问题:有没有可以实现推荐方法的python ML库?(PyBrain,Scikit?...?)
发布于 2013-01-04 10:26:39
你的数据中有多少这样的事件?如果你认为你需要至少100个龙卷风事件才能训练一个足够可靠的模型,并对其预测准确性进行足够好的估计。
将公开分发此数据集,例如在http://figshare.com上
发布于 2013-01-05 06:04:26
有各种各样的机器学习算法。您提供的信息并不表明任何一组算法在没有进一步调查的情况下都是优越的。扩展的时间序列确实表明,您可能需要一种算法来创建简化的特征向量。神经网络不会自动为您提供可靠性系数。如果您愿意公开发布包含数百个随机正负示例的数据集,那么随着时间的推移,可能会有许多不同的组应用不同的算法。各种“竞赛”网站的存在将加速这一过程。
https://stackoverflow.com/questions/14116828
复制相似问题