有人能解释一下数据挖掘中分类和聚类的区别吗?
如果可以,请给出两者的例子,以了解主要思想。
发布于 2011-02-21 10:44:57
通常,在分类中,您有一组预定义的类,并且希望知道新对象属于哪个类。
聚类试图对一组对象进行分组,并找出这些对象之间是否存在某种关系。
在机器学习的上下文中,分类是,聚类是。
也可以在维基百科上看看和。
发布于 2016-08-09 03:03:29
请阅读以下信息:
发布于 2014-12-28 18:18:51
如果您向任何数据挖掘或机器学习人员提出了这个问题,他们将使用术语supervised learning和unsupervised learning来解释聚类和分类之间的区别。因此,让我先向您解释一下监督和非监督这两个关键词。
监督学习:假设你有一个篮子,里面装满了一些新鲜水果,你的任务是在一个地方排列相同类型的水果。假设水果是苹果、香蕉、樱桃和葡萄。所以你已经从你之前的工作中知道了,每个水果的形状,所以很容易在一个地方排列相同类型的水果。在这里,您之前的工作称为数据挖掘中的训练数据。所以你已经从你的训练数据中学习到了这些东西,这是因为你有一个响应变量,它告诉你,如果一些水果有这样或那样的特征,它就是葡萄,就像每个水果一样。
您将从经过训练的数据中获得这种类型的数据。这种类型的学习被称为监督学习。这种类型的解决问题属于分类。所以你已经学会了这些东西,所以你可以自信地做好你的工作。
无人监督:假设你有一个篮子,里面装满了一些新鲜水果,你的任务是将相同类型的水果安排在一个地方。
这一次你对这些水果一无所知,你是第一次看到这些水果,那么你将如何安排同样类型的水果呢?
你首先要做的是拿起水果,然后选择那个特定水果的任何物理特征。假设你取了颜色。
然后你将根据颜色排列它们,然后分组将是像这样的东西。红色组:苹果和樱桃果。绿色组:香蕉和葡萄。所以现在你将采用另一个物理特征作为大小,所以现在组将是类似这样的东西。苹果红色,大号:。红色,体积小:樱桃果。绿色和大尺寸:香蕉。绿色和小尺寸:葡萄。工作完成了,大团圆结局。
在这里,你以前没有学到任何东西,意味着没有训练数据和响应变量。这种类型的学习称为无监督学习。聚类属于无监督学习。
https://stackoverflow.com/questions/5064928
复制相似问题