首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >K-NN算法在rapidminer中如何在相同距离下工作?

K-NN算法在rapidminer中如何在相同距离下工作?
EN

Stack Overflow用户
提问于 2019-08-12 10:26:15
回答 2查看 417关注 0票数 1

其实我已经在rapidminer论坛上问过了,但是还没有人给我答复..https://community.rapidminer.com/discussion/55963/how-k-nn-algorithms-work-with-same-distance-in-rapidminer#latest

对于具有相同欧氏距离的KNN算法,在rapidminer中找不到一个令人满意的答案。

我发现了一个类似的问题,但它不在rapidminer K Nearest-Neighbor Algorithm

比方说k=5,现在我试着通过获取5个最近的邻居来对一个未知物体进行分类。如果距离有很多相同的距离,该怎么办?如果在确定了4个最近的邻居之后,接下来的2个(或更多)最近的对象具有相同的距离和不同的标签?这2个或更多rapidminer中的哪个对象被选为第五个最近邻居?

我迷惑了..。我在excel中尝试,对于某些数据,结果与rapidminer不同。在excel中,结果标签是"LU":https://i.ibb.co/RSYnTWg/Capturess.jpg

但在rapidminer中的结果是"LT“:https://i.ibb.co/NKv0bmp/4.jpg

检查结果rapidminer加权投票为"LU“:https://i.ibb.co/r68y05v/5.jpg

rapidminer是如何处理这样的案例的。rapidminer如何对距离进行排序?我的数据有问题吗?或者如果距离相同,rapidminer随机排序?

EN

回答 2

Stack Overflow用户

发布于 2019-08-12 13:44:43

在这种情况下该怎么做还不是很好。

有些实现总是恰好返回5个对象(这意味着可能有多个不同的正确答案!)而其他人则使用所有捆绑的物体,而另一些人可能使用所有捆绑的物体,但减轻了它们的重量。

您需要检查源代码,因为如果手册不够详细,我不会感到惊讶。

票数 0
EN

Stack Overflow用户

发布于 2019-08-22 21:10:06

在这些距离相同的情况下,RapidMiner kNN使用训练时使用的ExampleSet的内部排序。因此,在内部,它选择它“第一次看到”的示例。

在构建kNN模型之前尝试更改排序,它应该会产生不同的结果。

你可以通过github上的官方源代码进行验证:https://github.com/rapidminer/rapidminer-studio/blob/master/src/main/java/com/rapidminer/operator/learner/lazy/KNNClassificationModel.java

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57455044

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档