我使用R的kmeans指令在数据集中执行k-means算法。我有一个关于我去的一些参数的问题。结果是:
Cluster means:
Sepal.Length Sepal.Width Petal.Length Petal.Width
1 5.006000 3.428000 1.462000 0.246000
在这种情况下,集群意味着什么?它是集群内所有物体距离的平均值?
同样在最后一部分,我有:
Within cluster sum of squares by cluster:
[1] 15.15100 39.82097 23.87947
(between_SS / total_SS = 88.4 %)
88.4%的价值是什么,它的解释是什么?
谢谢
发布于 2013-01-25 16:21:20
聚类均值组合在由输入变量定义的多变量空间中给出聚类的质心(中心)。因此,您显示的集群1的均值集是该集群的质心(中心)的坐标。它们被计算为分配给该簇的那些样本的每个变量的值的平均值。
88.4 %
是对聚类所解释的数据集中总方差的度量。k-means最小化样本的组内离散(扩散),即平方和。这最大化了组之间的分散。通过将样本分配到k个集群而不是n个(样本数量)集群,集群实现了88.4%的平方和减少。
https://stackoverflow.com/questions/14524818
复制