随机生成 k 个质心.
将数据集中每条记录,在这里可以当成一个点,分配到一个簇当中.分配的原则是将点对照 k 个质心,分配到离它最近的质心所在的那个簇....我们用 Python 实现它.
生成 K 个随机质心
虽然说是随机,但我们应该都能理解这个随机也应该是有约束条件的....将数据集中的点分配到簇的过程当中,要计算它们到质心的距离.
在机器学习领域,距离的表示有许多种,这里采用欧氏距离....把每个点分配到最近的质心,这就要求再建立一张专门的表,用来保存对应的信息.这张表分为 2 列,第一列是对应到数据集中每一行数据所分配到的簇的序号,第二列对应每个数据到质心的距离...., 4.03112887]
数组的第 0 列是簇的序号,而第 1 列存储的是数据集中每个点到质心的距离,我们称之为误差,误差越小,结果就越准确.