开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >机器学习day14 K均值算法

机器学习day14 K均值算法

作者头像

福贵

发布于 2020-08-25 09:54:12

发布于 2020-08-25 09:54:12

5390

举报

文章被收录于专栏：合集合集

K均值算法

K均值聚类的核心目标是将给定的数据集划分成K个簇，并给出每个数据对应的簇中心点。

数据预处理，包括但不限于归一化，离群点处理等
随机选择K个簇中心，我们记为

定义代价函数，

令t=0,1,2,3...，进行迭代，重复直至J收敛此时，对于每个样本

，将分配到距离最近的簇

对于每个簇k，重新计算各个簇的中心

K均值在迭代中，如果J没有达到最小值，那么首先重新计算当前簇的中心

，调整每个样例

所属的类别

来让J的值减少，之后计算

，调整簇中心

使J减少，如此重复迭代，直到J减少到最小值，

此时也收敛。

K均值算法示意图

K均值聚类算法迭代图

简单说，就是一开始我们假设的簇中心是随便找的，并不能将数据合理的分类，我们不断计算各个数据与最近簇中心的误差，然后又计算每类簇新的中心，算出J，直到无法减少，也这是收敛，表示我们找到了最佳的簇中心用来分类。

相关阅读：

机器学习day13非监督学习

机器学习day12线性判别分析

机器学习day11降维

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2020-08-23，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python与MySQL 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

目录

K均值算法
- K均值算法示意图