01
—
K-Means算法
在数据挖掘中,K-Means算法是一种 cluster analysis 的算法,主要通过不断地取离种子点最近均值的算法。
如下所示,分为3个簇,如何用K-Means正确聚类呢?
02
—
K-Means算法实施的前提
K-Means算法实施需要满足两个前提:
根据分布的先验概率,求得K
种子点的选取要cunning,尽量地远一点
03
—
K-Means算法思路
设置 K 个种子点;
遍历每个点,找到挨着最近的种子点,这就是它所属的簇;
遍历结束后,重新计算K个种子点的位置;
重复 Steps 2 and 3,直到 K个种子点的位置不再改变。
如下两个簇,初始位置:m1, m2,实施K-Means的时候可以看到种子点m1,m2的轨迹移动情况。
算法channel会有系统地,认真地推送:机器学习(包含深度学习,强化学习等)的理论,算法,实践,源码实现。期待您的参与!
领取专属 10元无门槛券
私享最新 技术干货