一种基于网格的密度峰值聚类算法
王 飞,王国胤,李智星,彭思源
重庆邮电大学
针对密度峰值聚类算法由于时空复杂度高而不能对大数据集进行有效聚类的问题,提出一种基于网格的密度峰值聚类算法.首先通过自适应多分辨率的网格划分的思想把数据划分到多个网格空间中,然后在每个网格空间中进行密度峰值聚类,利用网格边界合并网格空间中的聚类结果,从而得到原始数据集的聚类结果.本算法集成了网格聚类和密度峰值聚类算法的优点,网格的方法可以减少算法空间复杂度和算法计算量,进而降低了密度峰值聚类算法的时空复杂度.仿真实验结果表明,本算法能够有效处理数据聚类问题,并提高了传统算法的效率.
小型微型计算机系统
2017, 38(5): 1034-1038
作者简介王 飞 ,男,1989年生,硕士研究生,研究方向为智能信息处理、聚类分析等; 王国胤 ,男,1970年生,博士,教授、博士生导师,研究方向为Rough集理论、神经网络、机器学习、数据挖掘、不确定性人工智能、认知计算等; 李智星 ,男,1985年生,博士,研究方向为机器学习、数据挖掘; 彭思源,男,1991年生,硕士研究生,研究方向为计算智能、网络安全等.
http://xwxt.sict.ac.cn/CN/Y2017/V38/I5/1034
领取专属 10元无门槛券
私享最新 技术干货