我试图通过使用机器学习预测一个连续值来解决一个回归问题。我有一个由6个浮动列组成的数据集。
这些数据来自低价格的传感器,这就解释了我们很可能会有一些超乎寻常的价值。为了解决这个问题,在预测我的连续目标之前,我将预测数据异常,并使用它作为数据过滤器,但是我所拥有的数据没有标记,这意味着我有无监督异常检测问题。
用于本课题的算法有:局部孤立点因子、一类支持向量机、隔离林、椭圆包络和DBSCAN.。
在对这些算法进行拟合后,有必要对其进行评价,以选择出最优的算法。有没有人知道如何评估一种无监督的异常检测算法?
发布于 2021-03-22 00:04:25
唯一的办法是产生合成异常,这意味着引入离群值与知识,一个典型的离群点将是什么样子。
https://stackoverflow.com/questions/60276575
复制