分k个簇,起始随机选择k个点为簇的初始质心,选取距离k个质心最近的一个加入那个簇,之后更新质心,即簇内所有数值的平均,之后继续重复直到质心不再变化或者小于一个阈值。...数据集D中n个对象,D= \{o_i=(x_i1,x_i2,...x_in),i=1,2,...n\}
簇的集合C=\{C_1,C_2,...C_k\},C_i=\{o_1,o_2,...ol\} \...\frac{1}{|C_i|} \sum_{o_l \in C_i} x_{lj}
簇内距离平方和:可以做评价指标,多次以不同的初始质心运行,选取得到最小SSD的结果
SSD={\sum_{i=1}^k\