其实我已经在rapidminer论坛上问过了,但是还没有人给我答复..https://community.rapidminer.com/discussion/55963/how-k-nn-algorithms-work-with-same-distance-in-rapidminer#latest
对于具有相同欧氏距离的KNN算法,在rapidminer中找不到一个令人满意的答案。
我发现了一个类似的问题,但它不在rapidminer K Nearest-Neighbor Algorithm中
比方说k=5,现在我试着通过获取5个最近的邻居来对一个未知物体进行分类。如果距离有很多相同的距离,该怎么办?如果在确定了4个最近的邻居之后,接下来的2个(或更多)最近的对象具有相同的距离和不同的标签?这2个或更多rapidminer中的哪个对象被选为第五个最近邻居?
我迷惑了..。我在excel中尝试,对于某些数据,结果与rapidminer不同。在excel中,结果标签是"LU":https://i.ibb.co/RSYnTWg/Capturess.jpg
但在rapidminer中的结果是"LT“:https://i.ibb.co/NKv0bmp/4.jpg
检查结果rapidminer加权投票为"LU“:https://i.ibb.co/r68y05v/5.jpg
rapidminer是如何处理这样的案例的。rapidminer如何对距离进行排序?我的数据有问题吗?或者如果距离相同,rapidminer随机排序?
发布于 2019-08-12 13:44:43
在这种情况下该怎么做还不是很好。
有些实现总是恰好返回5个对象(这意味着可能有多个不同的正确答案!)而其他人则使用所有捆绑的物体,而另一些人可能使用所有捆绑的物体,但减轻了它们的重量。
您需要检查源代码,因为如果手册不够详细,我不会感到惊讶。
发布于 2019-08-22 21:10:06
在这些距离相同的情况下,RapidMiner kNN使用训练时使用的ExampleSet的内部排序。因此,在内部,它选择它“第一次看到”的示例。
在构建kNN模型之前尝试更改排序,它应该会产生不同的结果。
你可以通过github上的官方源代码进行验证:https://github.com/rapidminer/rapidminer-studio/blob/master/src/main/java/com/rapidminer/operator/learner/lazy/KNNClassificationModel.java
https://stackoverflow.com/questions/57455044
复制相似问题