首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用于多标签外部聚类评估指标的NMI和B3的等价物

NMI和B3是用于多标签外部聚类评估指标的两种常见方法。它们可以用来衡量多标签聚类算法的性能和准确度。

  1. NMI(Normalized Mutual Information,标准化互信息):
    • 概念:NMI是一种用于衡量两个聚类结果之间相似度的指标。它基于信息论中的互信息概念,通过计算聚类结果与真实标签之间的互信息来评估聚类的准确性。
    • 分类:NMI属于外部评估指标,即需要已知真实标签进行比较。
    • 优势:NMI可以解决聚类结果不一定与真实标签一一对应的问题,适用于多标签聚类任务。
    • 应用场景:NMI常用于文本分类、图像分割、社交网络分析等领域的多标签聚类任务。
    • 推荐的腾讯云相关产品:腾讯云提供了一系列人工智能和大数据分析产品,如腾讯云机器学习平台、腾讯云数据湖分析服务等,可以用于支持多标签聚类任务的实施。具体产品介绍和链接地址请参考腾讯云官方网站。
  • B3:
    • 概念:B3是一种用于多标签聚类评估的指标,它通过计算聚类结果与真实标签之间的一致性、完整性和平衡性来评估聚类的质量。
    • 分类:B3属于外部评估指标,需要已知真实标签进行比较。
    • 优势:B3综合考虑了聚类结果的多样性和一致性,能够更全面地评估聚类算法的性能。
    • 应用场景:B3常用于多标签聚类任务的评估和比较,特别适用于处理具有不确定标签的数据集。
    • 推荐的腾讯云相关产品:腾讯云提供了一系列大数据分析和人工智能产品,如腾讯云数据湖分析服务、腾讯云机器学习平台等,可以用于支持多标签聚类任务的实施。具体产品介绍和链接地址请参考腾讯云官方网站。

请注意,以上答案仅供参考,具体产品和链接地址请以腾讯云官方网站为准。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • Advanced Science | 利用动态集成剪枝来识别和解释单细胞分子异质性和转录调控

    本文介绍吉林大学李向涛教授课题组发表在Advanced Science的研究成果,题为“Reliable Identification and Interpretation of Single-cell Molecular Heterogeneity and Transcriptional Regulation using Dynamic Ensemble Pruning”。无监督聚类是从单细胞RNA测序(scRNA-seq)数据中识别细胞类型的一个重要步骤。然而,无监督聚类模型的一个共同问题是,在没有监督信息的情况下,目标函数的优化方向和最终生成的聚类标签可能是不一致的,甚至是任意的。为了应对这一挑战,作者提出了一个动态集成剪枝框架(DEPF)来识别和解释单细胞分子的异质性。特别是,开发了一个基于剪影系数的指标来确定双目标函数的优化方向。此外,采用分层自动编码器将高维数据投射到多个低维潜空间集,然后通过基本聚类算法在潜空间中产生聚类集合。随后,设计了一种双目标果蝇优化算法,以动态地修剪集合中的低质量基本聚类。

    02

    Nat. Commun.| 基于多模态深度学习方法的单细胞多组学数据聚类

    本文介绍由新泽西理工学院计算机科学系的韦智通讯发表在 Nature Communications 的研究成果:单细胞多模态测序技术的发展是为了在同一细胞中同时分析不同模态的数据,它为在单细胞水平上联合分析多模态数据从而识别不同细胞类型提供了一个独特的机会。正确的聚类结果对于下游复杂生物功能研究至关重要。然而,结合不同数据源对单细胞多模态数据进行聚类分析仍然是一个统计学和计算上的挑战。为此,作者提出了一种新的多模态深度学习方法scMDC,用于单细胞多组学数据聚类分析。scMDC是一种端到端的深度模型,它可以明确地表征不同的数据源,并联合学习深度嵌入的潜在特征以进行聚类分析。大量的模拟数据和真实数据实验表明,scMDC在不同的单细胞多模态数据集上均优于现有的单细胞单模态和多模态聚类方法。此外,运行时间的线性可扩展性使scMDC成为分析大型多模态数据集的有效方法。

    03

    CELL SYST|多目标神经网络框架预测化合物-蛋白相互作用和亲和力

    这次给大家介绍清华大学交叉信息研究院的曾坚阳教授课题组在Cell Systems上发表的论文“MONN: A Multi-objective Neural Network for Predicting Compound-Protein Interactions and Affinities”。分析化合物与蛋白质的相互作用 (Compound-Protein Interactions ,CPIs)在药物研发过程中起着至关重要的作用,迅速准确地预测作用位点和其间的亲和力有利于高效的药物研发。基于此问题,曾坚阳教授课题组引入深度学习,提出了一种预测化合物-蛋白相互作用和亲和力的多目标神经网络-MONN。作者在方法中引入了(i)捕获全局特征的超级节点、(ii)预测亲和力的GRU模块(Gate Recurrent Unit,门循环单元模型)、(iii)预测化合物-蛋白结合位点和判断其间的亲和力指标的多目标共享特征结构,使得其模型具有比现有模型更好的特征可解释性,有效捕捉了化合物与蛋白质的内在特征与联系,实现精确判断分子间的相互作用和亲和力。

    02

    Nature Methods | 单细胞基因组图谱数据集成的基准测试

    本文介绍由德国计算生物学研究所的M. Colomé-Tatché和Fabian J. Theis共同通讯发表在 Nature Methods 的研究成果:作者对来自23篇出版物的85批基因表达、染色质可及性和模拟数据的68种方法和预处理组合进行了基准测试,总共代表了分布在13个图谱集成任务中的超过120万个细胞。作者使用14个评估指标,根据可伸缩性、可用性及其在保留生物变异的同时消除批次效应的能力对方法进行评估。研究表明,高度可变的基因选择提高了数据集成方法的性能,而数据缩放推动方法优先考虑批次去除而不是保留生物变异。总体而言,scANVI、Scanorama、scVI 和 scGen 表现良好,尤其是在复杂的集成任务上,而单细胞 ATAC 测序集成性能受特征空间选择的影响很大。该文免费提供的 Python 模块和基准测试管道可以为新数据确定最佳的数据集成方法,还能对新开发的方法进行基准测试。

    01

    Nucleic Acids Res. | scIMC: 单细胞RNA测序数据插补方法的基准比较和可视化分析平台

    今天给大家介绍山东大学魏乐义教授与日本东京大学中井谦太教授合作发表在Nucleic Acids Research上的一篇文章 “scIMC: a platform for benchmarking comparison and visualization analysis of scRNA-seq data imputation methods”。目前在单细胞RNA测序(scRNA-seq)领域最主要的挑战是技术缺陷导致的“dropout”事件,其极大影响了下游任务分析,因此迫切需要有效的方法优化单细胞RNA测序数据。本文从以下四个方面对现有scRNA-seq数据插补方法进行系统的研究与比较:(1)恢复真实基因表达分布,(2)细胞聚类分析,(3)基因差异性表达分析,(4)重建细胞轨迹。研究表明,基于深度学习的方法通常比基于模型的方法表现出更好的整体性能,显示出深度学习在scRNA-seq数据插补方面的强大能力。此外,针对帮助没有计算机背景的研究人员方便实现插补方法以及结果的可视化分析,本文研究开发了在线分析平台scIMC,集成了多种现有方法以及常见的下游分析任务,能够方便用户针对不同的数据选择合适的数据插补方法进行分析与比较。

    01

    Annals of Neurology :脑血管健康相关的MRI标记物在认知衰退中的应用

    近些年Aβ和tau相关PET的运用为探究全身血管健康与大脑健康的关系提供了很好的途径。本研究旨在寻求早期脑血管健康相关的MRI影像标记物(包括结构、灌注、白质微结构完整性)。来自梅奥医学中心的研究者使用两个独立的样本,通过既往病史(高血压、高脂血症、心律失常、冠状动脉疾病、充血性心力衰竭、糖尿病和中风)总结被试心血管和代谢状况(CMC)来确定其血管的健康程度。利用多元回归模型,分析CMC与脑健康之间的关系,并控制年龄、性别、教育/职业和AD病理(Aβ和tau)等因素。研究者发现全身血管健康与内侧颞叶皮质变薄、广泛的脑低灌注和白质微结构破坏(主要包括胼胝体和穹窿等纤维束)密切相关。进一步的研究表明,胼胝体膝部的微结构完整性可以用于脑血管健康的早期评估,在独立样本中可进行验证,而且预测认知的能力高于Aβ沉积指标。最后,研究者总结全身血管健康状况对大脑结构和功能有显著影响,早期脑血管健康相关的MRI标记物独立于AD病理指标,可预测认知衰退。

    02

    治疗性经颅磁刺激后大规模脑电图神经网络的变化

    背景:经颅磁刺激(TMS)是一种有效的治疗难治性抑郁症的治疗方法。TMS可能诱发与抑郁症相关的异常回路的功能连接改变。脑电图(EEG)“微观状态”是指假设代表大规模静息网络的地形图。典型的微状态最近被提出作为重度抑郁症(MDD)的标志物,但目前尚不清楚它们在经颅磁刺激后是否会改变或如何改变。方法:对49例MDD患者在基线时和每日经颅磁刺激6周后进行静息脑电图检测。采用极性不敏感的修正k-means聚类方法将脑电图分割为组成的微观状态。微观状态通过sLORETA进行定位。重复测量混合模型检验了被试内随时间的差异,t检验比较了TMS应答组和无应答组之间的微观状态特征。结果:从所有可用的脑电图数据中鉴定出6个微观状态(MS-1 - MS-6)。对TMS的临床反应与MS-2特征的增加以及MS-3指标的降低相关。无反应者在微状态中没有显示出明显的变化。在TMS治疗过程中,MS-2(增加)和MS-3(减少)的发生率和覆盖率的变化与症状的变化幅度相关。结论:本研究确定了与治疗性经颅磁刺激作用相关的脑电图微观状态。结果表明,脑电图可观察到静息网络的特异性改变。

    03

    scGPT: 基于生成式人工智能构建单细胞多组学的基础模型

    今天为大家介绍的是来自Bo Wang团队的一篇关于单细胞多组学的论文。生成式预训练模型在自然语言处理和计算机视觉等各个领域取得了显著的成功。特别是将大规模多样化的数据集与预训练的转换器相结合,已经成为开发基础模型的一种有前途的方法。文本由单词组成,细胞也可以通过基因进行表征。这种类比启发作者探索细胞和基因生物学基础模型的潜力。通过利用呈指数增长的单细胞测序数据,作者首次尝试通过对超过1000万个细胞进行生成式预训练来构建单细胞基础模型,展示了生成式预训练scGPT有效地捕捉了有关基因和细胞的有意义的生物学洞见。此外,该模型可以轻松进行微调,以在各种下游任务中实现最先进的性能,包括多批次整合、多组学整合、细胞类型注释、基因扰动预测和基因网络推断。

    01
    领券