默认层次聚类方法是一种无监督学习算法,用于将数据集中的样本按照相似性进行分组。它基于样本之间的距离或相似性度量,通过逐步合并最相似的样本或聚类来构建层次结构。
默认层次聚类方法有两种主要类型:凝聚层次聚类和分裂层次聚类。
- 凝聚层次聚类(Agglomerative Hierarchical Clustering):凝聚层次聚类从每个样本作为一个独立的聚类开始,然后逐步合并最相似的聚类,直到所有样本都被合并为一个聚类。这种方法的优势在于可以处理大型数据集,并且不需要预先指定聚类的数量。常用的凝聚层次聚类算法有单链接、完全链接和平均链接。
- 单链接(Single Linkage):通过计算两个聚类中最相似样本之间的距离来合并聚类。推荐的腾讯云产品是腾讯云机器学习平台(https://cloud.tencent.com/product/tcmlp)。
- 完全链接(Complete Linkage):通过计算两个聚类中最不相似样本之间的距离来合并聚类。推荐的腾讯云产品是腾讯云机器学习平台(https://cloud.tencent.com/product/tcmlp)。
- 平均链接(Average Linkage):通过计算两个聚类中所有样本之间的平均距离来合并聚类。推荐的腾讯云产品是腾讯云机器学习平台(https://cloud.tencent.com/product/tcmlp)。
- 分裂层次聚类(Divisive Hierarchical Clustering):分裂层次聚类从所有样本作为一个聚类开始,然后逐步将聚类分裂为更小的子聚类,直到每个样本都成为一个独立的聚类。这种方法的优势在于可以处理高维数据和非球形聚类。常用的分裂层次聚类算法有二分K均值和CURE。
- 二分K均值(Bisecting K-means):通过递归地将聚类分裂为两个子聚类,直到满足停止条件。推荐的腾讯云产品是腾讯云机器学习平台(https://cloud.tencent.com/product/tcmlp)。
- CURE:通过选择最不相似的聚类进行分裂来构建层次结构。推荐的腾讯云产品是腾讯云机器学习平台(https://cloud.tencent.com/product/tcmlp)。
聚类图中的默认层次聚类方法可以根据数据集的特点和需求选择适合的方法。它在许多领域都有广泛的应用,例如市场细分、社交网络分析、图像分割等。
注意:以上推荐的腾讯云产品仅供参考,具体选择应根据实际需求进行评估。