)
① 没有类标签 : 虽然将数据集分成若干子集 , 但是以什么依据分 , 事先是不知道的 ;
② 没有训练集 : 分类操作中 , 将数据集先分成训练集 和 测试集 , 但是在聚类中 , 只有一个数据集..., 聚类算法分析整个数据集 , 学习训练出以什么标准进行聚类 , 然后将相似的数据样本分组 , 这就是聚类结果 ;
③ 聚类分组 : 给定数据集 , 有完整的属性值 ; 相似的数据放在同一组 , 不相似的数据放在另外一组...聚类分析目的 : 聚类分析 希望根据数据的特征 , 可以是
1
个特征 , 也可以是若干特征 , 找出数据之间的相似性 , 相似的数据放在一个数据组中 , 这里不是分类 , 要注意区分分组与分类 ,...位置 , 等因素 , 对该数据集进行聚类分析 , 为数据集分组 , 便于城市规划 ;
③ 地理用途 : 将地球上不同地区的情况当做数据集 , 录入该地区的各种属性 , 聚类分析这些地区 , 并将其分组...高质量 聚类 要求 :
① 同一分组 : 相同分组中的数据样本 , 高度相似 ;
② 不同分组 : 不同分组中的数据样本 , 高度不相似 ;
3 .