研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。
作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 本文从安全攻防视角深入探讨层次聚类在真实业务中的核心价值,揭示其并...
作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 本文从安全攻防视角深入剖析K-Means算法的假设条件与失败场景,...
中国互联网络信息中心 | 工程师 (已认证)
在每天超过3000亿封电子邮件穿梭于全球网络的今天,钓鱼邮件早已不是“中奖通知”或“尼日利亚王子”的拙劣骗局。它们披着合法外衣,模仿企业IT部门的语气、伪造银行...
在大家读这篇文章前,如果对决策树还没有什么概念,可以先看看前一篇《构建AI智能体:决策树的核心机制(一):刨根问底鸢尾花分类中的参数推理计算》,先简单回顾一下决...
接下来,我们应用聚类算法以识别细胞类型或空间域。请注意,在此示例中,我们仅使用分子特征(基因表达)作为聚类的输入。
打开后台,粉丝留言催更的小红点堆了一页;想追热点,磨磨蹭蹭写好发出去,热度早过了;更头疼的是,好不容易产出一篇,还要挨个平台手动发布,折腾完半天没了。
总的来说,K-均值聚类算法是一种常用且有效的聚类算法,但在使用时需要注意选择适当的K值和初始质心,并处理好噪声和离群点的情况。
近日,积算科技的一站式AlphaFold3在线算力服务已开放。其内置优化后的AlphaFold3模型,支持图形化界面创建容器、低代码启动任务,通过在线服务让科研...
引入高斯混合层次模型(HMoGs),将降维与聚类统一为单一概率模型。该模型提供:1) 模型似然的闭式表达式;2) 潜在状态与聚类归属的精确推断;3) 最大似然优...
K-Means 是一种基于划分的无监督学习算法,旨在将数据集划分为 K 个簇,使得簇内数据点之间的相似度尽可能高,而簇间数据点的相似度尽可能低。相似度通常通过计...
“聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性。” ——wikipedia
在历时一个半月的笔试面试后,我又回来分享知识了,后续应该只能一周一更了,要去公司当牛马了,不过好在结果顺利,收获了三个offer,已经打算去鹅厂实习了
最近看到一篇有意思的论文《Is Semantic Chunking Worth the Computational Cost?[1]》,论文探讨了在检索增强型生...
今天是我们的第7站,一起了解下聚类算法基本概念 以及 通过聚类算法辅助用户画像的案例。
本文在基础的K-means聚类算法的基础上,结合该算法固有的一些缺陷,提出了一些改进措施,即通过改进的K-means聚类算法来对“B2C电商评论信息数据集”数据...
在微生物基因组中,蕴藏着大量编码抗生素、抗癌药物等重要化合物的生物合成基因簇(BGCs)。传统基于规则的方法(如antiSMASH)在新型BGC发现中存在局限,...
在应用 K-均值聚类算法时,需要根据具体的数据集特点和要达到的聚类目标来合理选择参数,以获得较好的聚类效果。
总的来说,K-均值聚类算法是一种简单且高效的聚类算法,适用于许多场景,但在一些特定情况下可能表现不佳。在使用该算法时,需要根据具体问题和数据集来选择合适的参数和...