前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >生物医学组学数据分类Deep Centroid

生物医学组学数据分类Deep Centroid

作者头像
DrugAI
发布2025-02-18 22:45:40
发布2025-02-18 22:45:40
750
举报
文章被收录于专栏:DrugAIDrugAI

摘要

动机

使用生物医学组学数据对样本分类是生物医学研究中广泛采用的方法。然而,数据集通常具有挑战性的特征,包括高维度、有限的样本量以及不同来源的固有偏差。这些因素限制了传统机器学习模型的性能,尤其是在应用于独立数据集时。

可用性和实现

GitHub (github.com/xiexiexiekuan/DeepCentroid)

Figshare (https://figshare.com/articles/software/Deep_Centroid_A_General_Deep_Cascade_Classifier_for_Biomedical_Omics_Data_Classification/24993516)

材料和方法

表1 本研究中使用的所有数据集的详细信息

结果

为了解决这些挑战,提出了新的分类器Deep Centroid,结合了最近质心分类器的稳定性和深度级联策略的强大拟合能力。Deep Centroid是种集成学习方法,具有多层级联结构,包含特征扫描和级联学习阶段,可以动态调整训练规模。将Deep Centroid应用于3个精准医学应用:癌症早期诊断、癌症预后和药物敏感性预测。使用无细胞DNA片段化、基因表达谱和DNA甲基化数据。实验结果表明,在所有3个应用中,Deep Centroid的表现优于6种传统的机器学习模型,展示了其在生物组学数据分类中的潜力。此外,功能注释显示,该模型扫描的特征具有生物学意义,表明其从生物学角度具有可解释性。强调了Deep Centroid在生物医学组学数据分类中的应用前景,特别是在精准医学领域。

图1 Deep Centroid模型结构的示意图。在特征扫描阶段,使用随机扫描策略,模型将异质数据划分为多个特征集,每个特征集对应一个最近质心分类器。在级联学习阶段,每层模型训练完成后,输出结果与优化后的特征一起作为新特征继续用于下一层的训练。当模型收敛时,模型停止训练,并使用多数投票来获得预测结果。

图2 Deep Centroid在癌症早期检测中的性能。(a) Deep Centroid在交叉验证中的分类性能。(b) Deep Centroid在独立验证中的分类性能。(c) 重要特征的功能注释结果。

图3 Deep Centroid在癌症预后中的性能。(a) Deep Centroid在交叉验证中的分类性能。(b) Deep Centroid在独立验证中的分类性能。(c) 重要特征的功能注释结果。

图4 Deep Centroid在药物敏感性预测中的性能。(a) Deep Centroid在所有药物中的分类性能。(b) Deep Centroid在他莫昔芬中的分类性能。(c) 基因表达数据中扫描的重要特征的功能注释结果。(d) DNA甲基化数据中扫描的重要特征的功能注释结果。

图5 消融实验结果。(a) 在早期癌症诊断、(c) 癌症预后和 (e) 药物敏感性预测中,使用随机扫描策略和滑动窗口扫描策略的模型性能比较。(b) 在早期癌症诊断、(d) 癌症预后和 (f) 药物敏感性预测中,使用最近质心分类器作为基分类器的模型与使用随机森林作为基分类器的模型以及使用多种分类器模型作为基分类器的模型之间的性能比较。

参考

[1] Bioinformatics. 2024 Feb 1;40(2):btae039. doi: 10.1093/bioinformatics/btae039

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档