如果异常数据与正常数据之比为1:10,即使真阴性率为99%,也会出现100条假阳性数据,且精度( TP/(TP+FP) )较低。
要使这类异常检测得到实际应用,我认为有必要建立一个预测精度较高的模型。
世界上异常检测的实际例子是如何处理这个问题的?对于不允许高预测精度的困难问题或异常数目太少的问题,是否很难将异常检测用于实际应用?
发布于 2021-05-14 18:04:40
我认为您可能正在做的假设是,这个任务需要一个机器学习模型,但是诚实地说,统计方法和不那么流行的算法是可用的。
现实情况是,对数据进行ML模型的培训将是一场斗争,因为严重的类不平衡和低数量的异常。这就是为什么预先训练的模型具有吸引力,尤其是神经网络。
为了了解各种选项,我发现Python pyOD是一个很好的资源。它有大约30种不同的方法来检测异常值。
https://datascience.stackexchange.com/questions/94433
复制相似问题