首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Kmeans聚类评价

Kmeans聚类评价
EN

Stack Overflow用户
提问于 2017-01-24 05:20:28
回答 1查看 446关注 0票数 0

我对聚类评估中的SSB计算有点困惑。

哪里

代码语言:javascript
复制
|Ci| is the size of cluster i
ci is the centroid of cluster i
c is the centroid of the overall data 

这个“整体数据的质心”是什么?在任何地方,它都被提到为总体数据的中心。

这是我们计算的初始质心吗?

编辑

从anony-Mousse的回答中得到更多的澄清。

假设我们已经在聚类中完成了一次迭代。

代码语言:javascript
复制
step 1: k =2, select random centroids(Let my random centroids be (2,1,3) and (3,1,1))
step 2: do clustering(Now 2 clusters are formed)
step 3: then find new centroids(by averaging data for each cluster, After averaging let my new clusters be (2.3,1.5,3) and (6.7,1,2))

所以现在我需要计算SSB。

现在我需要计算整个数据的质心(输入数据),让这个值为(25,30.5,78)

代码语言:javascript
复制
total no of values in c1 = 20
total no of values in c2 = 30

ssbc1 = 20*(dist([2.3,1.5,3],[25,30.5,78]))^2
ssbc1 = 30*(dist([6.7,1,2],[25,30.5,78]))^2
total ssb = ssbc1+ssbc2

是这样的吗?

EN

回答 1

Stack Overflow用户

发布于 2017-01-25 00:28:20

质心是每个维度中的平均值。

“在所有数据中”说不使用聚类。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41820540

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档