Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >深度学习模型在单细胞数据的分析

深度学习模型在单细胞数据的分析

作者头像
智能生信
发布于 2022-04-06 12:02:33
发布于 2022-04-06 12:02:33
1.4K0
举报
文章被收录于专栏:智能生信智能生信

作者 | 崔雅轩 编辑 | 李仲深

今天给大家介绍的是俄亥俄州立马勤教授在nature reviews molecular cell biology发表的文章《Deep learning shapes single-cell data analysis》。作者在此篇综述文章中主要提到了深度学习模型对于单细胞测序领域具有巨大的潜力。目前已经在单细胞领域中应用了大量深度学习模型来进行数据分析,但仍有许多挑战和可能的新发展有待探索。在这篇评论中,作者考虑了采用深度学习方法来分析单细胞数据的进展、局限性、最佳实践和前景。

一、介绍

单细胞技术大大提高了对单个细胞之间的异质性和功能多样性的理解,并为生物学和精准医学带来了巨大的机会,特别是研究细胞经历快速分化成不同的亚群(例如,在耐药性研究,肿瘤复发研究,免疫细胞研究)或应对外部扰动(例如,在covid-19发病机制)。与单细胞技术发展的同时,人工智能领域(深度学习)的突破,重新定义了通过使用复杂的人工神经网络结构来分析大规模数据的能力。深度学习最近已经在AlphaFold2的蛋白质结构预测中得到了证明,并且使用深度学习在单细胞数据分析中是可行的。

二、为单细胞研究开发匹配的深度学习模型

通过推广深度学习模型的设计和优化,单细胞数据的高度异质性可以在广泛的课题领域中进行分析。外部的生物知识或数据(例如,表型信息或批量组学数据)可以被纳入模型中,以作为约束条件改进预测。单细胞数据通常包含有限数量的标签和注释,这可能会导致模型过拟合和性能较差。但所幸,在许多情况下新兴半监督学习(结合少量的标签数据与大量的无标签数据)和自我监督学习通常可以实现同样准确的结果而不需要额外的标签。此外,提高深度模型的可信度,特别是模型泛化在不同的实验平台和条件,和提高对噪声数据的鲁棒性。此外,提供一些预测结果的可信度评估(例如,P-values or z-scores)可以指导用户做出生物推断。

深度学习模型使用者通常会发现,根据可用性和准确性来决定何时以及如何选择深度学习工具来进行单细胞数据分析很具有挑战性。已被广泛应用于单细胞数据分析,与Seurat相反,深度学习可以揭示更多的内在关系和机制。最佳拟合深度学习模型的选择通常是由特定目标驱动的,例如,是细胞聚类还是细胞分类,特征顺序是否重要,或者不同模式之间的拓扑关系是否重要。最佳拟合学习模型模型的选择通常是由一个特定的目标驱动的,例如,无论是细胞聚类还是细胞分类,以及特征顺序是否重要,还是不同模式之间的拓扑关系是否重要。由于用于单细胞数据分析的深度学习模型尚未成熟,因此运行多个工具来比较可能更有价值的。

三、深度学习在单细胞数据分析中的局限性

虽然现有的深度学习工具已经证明了它们在各种环境下分析单细胞数据的能力,但它们还没有被研究小组在其生物学研究中广泛使用。表格仅包括原始方法学论文的案例研究。虽然新技术的建立往往需要时间,但目前的深度学习方法在单细胞数据分析中的也有很大的局限性。特别是,深度学习方法通常需要大量的数据和计算资源来训练;它们的结果可能不可靠(性能由于数据噪声、参数设置和新的输入数据而变化);大多数深度学习模型是缺乏可扩展性的黑盒;几乎所有的深度学习工具都需要广泛的计算机技能来使用。因此,深度学习方法的发展与它在多种生物系统中的广泛应用之间仍存在差距。

四、单细胞数据分析中的深度学习前景

深度学习在单细胞数据分析中的应用为未来的探索具有广阔的前景。对于方法的发展,快速发展的尖端深度学习方法的不断适应。由于单细胞生物学中可用的注释数据有限,因此有应用主动学习(交互式地建议新的数据标记来训练模型)来建立基于少数训练样本的模型的空间。更高程度地采用端到端深度学习框架(例如,在AlphaFold2中)可以促进更全面和全面地使用训练数据,以解释所有输入特性和关系。基于模型的深度学习有望进一步深入分析单细胞生物学。结构或拓扑感知方法,以及受物理启发和生物启发的框架将信息集成到深度学习模型中,用于其他应用;在单细胞生物学中也可能有类似的应用。此外,深度学习的发展可以支持对潜在的生物学机制的更好的解释,包括因果或调节关系,对外部刺激的细胞类型特异性反应,以及驱动疾病或表型的细胞亚群。开发集成系统和部署云平台将使没有编程技能的用户能够通过web服务使用单细胞深度学习工具。这些工具还可以帮助培训下一代研究人员和临床医生,特别是允许精确医疗更容易实现医疗实践。

基于深度学习的方法展示了在单细胞数据分析的能力,如理解脑细胞类型的复杂性相关的感知和复杂的行为,并推断肿瘤和免疫细胞群的多样性大大加快发现新的发病机制和癌症治疗。我们希望加快研究的脚步,以提供独特的见解,但如果不结合单细胞数据和深度学习技术,这可能就无法实现。另一个不断增长的领域是深度学习模型从可预测和可解释的迁移到更可操作的,即可以直接给出医院治疗的建议,如治疗靶点、药物再利用和药物组合。

原文链接

https://www.nature.com/articles/s41580-022-00466-x.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nat Rev Mol Cell Biol|深度学习如何影响单细胞数据分析
2022年2月23日,俄亥俄州立大学医学院生物医学信息学系的 Qin Ma 和密苏里大学电子工程和计算机科学系的 Dong Xu 在 Nat Rev Mol Cell Biol 杂志 (2020年影响因子94.444) 发表文章,介绍了深度学习方法在单细胞数据分析中应用的进展、局限性、最佳实践和前景。
智药邦
2022/03/04
5750
Nat Rev Mol Cell Biol|深度学习如何影响单细胞数据分析
敢答 | 单细胞生物学路在何方?
"喜看稻菽千重浪,遍地英雄下夕烟"。快速发展的单细胞生物学(Single-cell ,为我们理解细胞类型、细胞状态、细胞间相互作用和组织结构提供了单细胞水平视野。单细胞分析适于解析细胞异质性较高的的动态生物学过程,如细胞命运决定、组织模式和发育轨迹推断。除了这些生理背景外,单细胞方法也被广泛应用于疾病研究,癌症和传染病。了解疾病背景下的细胞异质性具有重要的临床应用,包括开发改进的诊断工具和靶向治疗方法。此外,单细胞生物学使细胞重编程与合成生物学结合成为可能。
生信菜鸟团
2023/10/08
3700
敢答 | 单细胞生物学路在何方?
CellPress|单细胞技术和基于深度学习的药物反应预测
今天给大家介绍的是俄亥俄州立大学Qin Ma课题组发表在发表在Trends in Pharmacological Sciences的一篇综述,“Single-Cell Techniques and Deep Learning in Predicting Drug Response”。
DrugAI
2021/02/02
9940
CellPress|单细胞技术和基于深度学习的药物反应预测
AlphaFold3来了!全面预测蛋白质与所有生命分子相互作用及结构,引领药物研发新革命
近年来,深度学习领域的迅速进步对蛋白质设计产生了显著影响。最近,深度学习方法在蛋白质结构预测方面取得了重大突破,使我们能够得到数百万种蛋白质的高质量模型。结合用于生成建模和序列分析的新型架构,这些方法在过去几年里极大改变了蛋白质设计领域,提高了识别新蛋白质序列和结构的准确性和能力。深度神经网络现在能够学习和提取蛋白质结构的基本特征,预测它们与其他生物分子的相互作用,并且有潜力创造用于治疗疾病的新型药物。
Tom2Code
2024/07/19
1.5K0
AlphaFold3来了!全面预测蛋白质与所有生命分子相互作用及结构,引领药物研发新革命
NC综述 | 深度学习在生物科学领域的应用
作为一枚长期关注BT与IT融合的小编,最近挖到一篇NC综述,作者从蛋白质结构预测、蛋白质功能预测、基因工程、系统生物学和数据集成以及系统发育推断五个方面讨论了深度学习(DL)的最新进展、局限性和未来展望。
尐尐呅
2022/05/17
6460
NC综述 | 深度学习在生物科学领域的应用
生物医学研究和临床应用中单细胞RNA-seq数据分析指南
单细胞RNA测序(scRNA-seq)在生物医学研究中的应用,提高了对疾病发病机制的认识,并为新的诊断和治疗策略提供了有价值的见解。随着包括临床样本在内的高通量scRNA-seq数据的扩大,对这些大量数据的分析已经成为进入这一领域的研究人员的一个必须面对的前景。在这里,回顾了典型scRNA-seq数据分析的工作流程,包括原始数据处理和质量控制,适用于几乎所有scRNA-seq数据集的基本数据分析,以及应针对特定科学问题量身定制的高级数据分析。在总结每个分析步骤的当前方法的同时,还提供了软件和脚本的在线数据。对一些具体的分析任务和方法提出了建议和注意事项。
追风少年i
2022/12/08
1.9K0
生物医学研究和临床应用中单细胞RNA-seq数据分析指南
Nat. Methods | 基于单细胞RNA测序的植入前小鼠和人类胚胎深度学习模型
Deep learning-based models for preimplantation mouse and human embryos based on single-cell RNA sequencing
DrugAI
2024/12/05
2390
Nat. Methods | 基于单细胞RNA测序的植入前小鼠和人类胚胎深度学习模型
视角 | Nature | 迈向分子细胞生物学中的多模态基础模型
◉ 各种分析技术在单细胞分辨率和空间分布上提供了丰富多样的数据。◉ 分析方法的数据可以揭示中心法则中的多个步骤。◉ 内嵌文本列出了用于多组学分析的常见测序方法。◉ 有关当前可用方法的完整列表,我们建议读者参考最近的综述。◉ Pol II指聚合酶II;scRNA-seq指单细胞RNA测序;sgRNA指单导向RNA。◉ 重要潜在应用的机会可以重建细胞动态。◉ 箭头表示这些应用的底层机制是相互关联的,使用MFMs解决一个任务可以有助于其他任务。
生信菜鸟团
2025/04/18
1890
视角 | Nature | 迈向分子细胞生物学中的多模态基础模型
单细胞 | 人类单细胞数据的机器学习模型中的偏差
◉ 社会偏见源于医疗系统中的结构性不平等。◉ 临床偏见源于临床数据收集和处理中的一致性问题,这引入了变异性。◉ 队列偏见源于队列构成的偏差,包括人口统计学和临床多样性。◉ 单细胞测序偏见源于技术限制和测序方法的变异性,影响数据质量。◉ 机器学习偏见源于算法和模型参数的选择,这可能产生或放大偏见。◉ 最后,结果解释偏见源于灵活的可视化和解释工具,这些工具持续或强化偏见结论,影响下游的科学和临床见解。
生信菜鸟团
2025/04/18
920
单细胞 | 人类单细胞数据的机器学习模型中的偏差
Trends in Cell Biology | 细胞动力学研究中的机遇与挑战
今天为大家介绍的是来自Viji M. Draviam团队的一篇论文。人工智能(AI)的发展促进了计算机视觉和深度学习(DL)技术在显微镜图像和影片评估中的应用增加。这种应用不仅解决了动态细胞生物过程的定量分析难题,还开始支持药物开发、精准医疗和基因组-表型组映射方面的进展。作者调查了现有的基于AI的技术和工具,以及开源数据集,特别关注于细胞和亚细胞结构及动态的分割、分类和跟踪的计算任务。作者从计算视角总结了显微镜视频分析中长期存在的挑战,并回顾了深度学习引导自动化在细胞动态研究中的新兴研究前沿和创新应用。
DrugAI
2024/05/22
1970
Trends in Cell Biology | 细胞动力学研究中的机遇与挑战
热点综述 | 人工智能和机器学习在预测医学中的进展
传统的机器学习 (ML) 技术在生成用于组学分析的预测模型方面取得了部分成功,但在处理数据内的潜在关系以实现更准确的预测方面存在局限性。2024年2月,《Journal of Human Genetics》发表综述文章,探讨了通过应用深度学习 (DL),特别是卷积神经网络 (CNN),预测建模发生的革命性转变。
尐尐呅
2024/03/13
5810
热点综述 | 人工智能和机器学习在预测医学中的进展
Deepcell 发布首个单细胞形态学数据集
来源:ScienceAI本文约1200字,建议阅读5分钟这些数据集是在 Deepcell 的高通量平台上生成的,该平台由成像和分选仪器、AI 模型和软件套件组成。 Deepcell 是人工智能(AI)驱动的单细胞分析领域的先驱,旨在推动深度生物学发现,2 月 6 日宣布,它已经发布了三个数据集,使研究人员能够探索新的高维形态数据。这些数据集是在 Deepcell 的高通量平台上生成的,该平台由成像和分选仪器、AI 模型和软件套件组成。 AI 模型被称为人类基础模型 (Human Foundation Mo
数据派THU
2023/02/23
4210
Deepcell 发布首个单细胞形态学数据集
一文全面了解蛋白质组学,从单细胞到临床应用 | Nature 综述
◉ 蛋白质从包括单细胞、组织和体液在内的样品中提取,并使用特定的蛋白水解酶消化成肽。◉ 在多重分析时,这些肽通过化学方法用稳定同位素标记的标签进行标记。◉ 样本制备过程的自动化提高了蛋白质组学分析的稳定性和通量。◉ 然后,标记或非标记的肽混合物经过先进的LC分离,包括微柱阵列柱(µPAC)和预形成梯度的LC。◉ 分离后的肽在不同的保留时间(RT)从LC系统中洗脱出来,并进行DDA或DIA分析用于发现应用,或者针对非发现应用如临床检测进行靶向MS分析。◉ 所描述的质谱硬件包括最新的混合仪器,如timsTOF和Astral仪器,它们结合了被困离子迁移率分离或Orbitrap与飞行时间质量分析器,以促进增强的蛋白质鉴定和定量。◉ 该工作流程应用于探索蛋白质相互作用网络并实现全面的生物体蛋白质组研究,将分子数据与生物学功能和疾病机制联系起来。
生信菜鸟团
2025/03/06
5320
一文全面了解蛋白质组学,从单细胞到临床应用 | Nature 综述
TEDDY:单细胞生物学基础模型及其在疾病分类中的实践
单细胞RNA测序(scRNA-seq)技术的快速发展为解析细胞异质性和疾病机制提供了高分辨率的数据基础。然而,如何从海量单细胞数据中提取有意义的生物学信息仍是一项挑战。
实验盒
2025/03/17
1470
TEDDY:单细胞生物学基础模型及其在疾病分类中的实践
蛋白设计中的深度学习方法
今天为大家介绍的是来自耶鲁大学Gregory W.Kyro团队的一篇论文。深度学习已经改变了蛋白质设计领域,实现了精确的结构预测、序列优化和从头开始的蛋白质生成。通过AlphaFold2、RoseTTAFold、ESMFold等在单链蛋白质结构预测方面的进展已经达到接近实验精度的水平,这启发了后续工作通过AlphaFold Multimer、RoseTTAFold All-Atom、AlphaFold 3、Chai-1、Boltz-1等扩展到生物分子复合物。生成模型如ProtGPT2、ProteinMPNN和RFdiffusion已经突破了基于自然进化的限制,实现了序列和主链设计。最近,包括ESM3在内的序列-结构联合共同设计模型,将这两种模式整合到统一框架中,从而提高了可设计性。尽管取得了这些进展,但在建模序列-结构-功能关系以及确保训练数据所涵盖的蛋白质空间区域之外的稳健泛化方面仍然存在挑战。未来的进展可能会集中在序列-结构-功能共同设计框架上,这些框架能够比独立处理这些模式的模型更有效地建模适应度景观。目前的能力,加上令人眩晕的进步速度,表明该领域即将实现快速、合理地设计具有定制结构和功能的蛋白质,超越自然进化所施加的限制。
DrugAI
2025/04/15
1060
蛋白设计中的深度学习方法
专访姚建华、杨帆:腾讯 AI Lab 为何瞄准单细胞蛋白质组学
用一个比喻来说,它就像一把钥匙,能够开启细胞内部世界的大门,让我们得以窥见细胞如何通过蛋白质的相互作用来执行生命活动。
AI科技评论
2024/04/13
1K0
专访姚建华、杨帆:腾讯 AI Lab 为何瞄准单细胞蛋白质组学
DrugAI实验室研发单细胞RNA测序数据分析工具箱autoCell
近日,湖南大学DrugAI实验室在Cell子刊《Cell Reports Methods》上发表名为”Graph Embedding and Gaussian Mixture Variational Autoencoder Network for End-to-End Analysis of Single-Cell RNA-Sequencing Data”的研究论文,提出了一种用于scRNA-seq的“dropout”插补和特征提取的深度学习框架autoCell。autoCel是一种变分自动编码网络,它结合了图嵌入和概率深度高斯混合模型来推断高维稀疏scRNA-seq数据的分布。autoCell提供了一个深度学习工具箱,用于对大规模sc/snRNA-seq数据进行端到端分析,包括可视化、聚类、插补和疾病特异性基因网络识别。
DrugAI
2023/02/17
7340
DrugAI实验室研发单细胞RNA测序数据分析工具箱autoCell
单细胞人物志-尼古拉斯·纳文
尼古拉斯·纳文(Nicholas Navin)于2003年在斯基德莫尔学院取得细胞生物学学士,随后进入冷泉港实验室和石溪大学进行了研究生培训,师从美国国家科学院院士迈克尔·威格勒 (Michael Wigler),并于2010年取得分子遗传学博士学位,随后担任冷泉港实验室癌症遗传学博士后研究员。
生信技能树jimmy
2020/03/27
1.2K0
谷歌开发出的深度学习算法模型,可用于预测DNA链等亚细胞结构的变化 | 技术
该算法通过研究细胞的变化来进一步研究相关疾病的变化,获得了多项人类尚未发现的研究成果。 眼睛是心灵的窗口,但从去年开始,谷歌的研究团队就利用机器学习将眼睛转化为检查人体健康的“窗口”,他们通过算法分析人体的高精度3D视网膜照片发现,图像里面包含的信息可以用来判断出一个人的血压、年龄和吸烟状况。 近日,研究团队又获得了新的进展,利用算法分析其亚细胞结构(如线粒体、染色体、DNA链等)的变化后,发现了通过分析“眼睛”,我们可以判断一个人是否有患心脏病的风险。 不同于以往,这里的研究成果不断,背后的首要功臣是谷歌
镁客网
2018/05/29
7700
王炸组合『单细胞+空间转录组』的科研应用【3】:胚胎发育/干细胞分化
单细胞转录组测序(scRNA-seq)和空间转录组学等新兴技术为分析细胞组织、形态和分子特性的分化以及系谱分配开辟了新途径。
尐尐呅
2021/08/24
6380
王炸组合『单细胞+空间转录组』的科研应用【3】:胚胎发育/干细胞分化
推荐阅读
相关推荐
Nat Rev Mol Cell Biol|深度学习如何影响单细胞数据分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档