前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >一文全面了解蛋白质组学,从单细胞到临床应用 | Nature 综述

一文全面了解蛋白质组学,从单细胞到临床应用 | Nature 综述

作者头像
生信菜鸟团
发布2025-03-06 21:42:35
发布2025-03-06 21:42:35
720
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

Basic Information

  • 英文标题:Mass-spectrometry-based proteomics: from single cells to clinical applications
  • 中文标题:基于质谱的蛋白质组学:从单细胞到临床应用
  • 发表日期:26 February 2025
  • 文章类型:Review
  • 所属期刊:Nature
  • 文章作者:Tiannan Guo | Matthias Mann
  • 文章链接:https://www.nature.com/articles/s41586-025-08584-0

Abstract

Para_01
  1. 基于质谱(MS)的蛋白质组学已经发展成为一种全面分析生物系统的强大工具。
  2. 最近的技术进步显著提高了灵敏度,使得单细胞蛋白质组学和组织的空间分析成为可能。
  3. 同时,通量和鲁棒性的提高促进了临床应用。
  4. 在本综述中,我们介绍了蛋白质组学技术的最新发展,包括新颖的样品制备方法、先进的仪器和创新的数据采集策略。
  5. 我们探讨了这些进展如何推动蛋白质-蛋白质相互作用、翻译后修饰和结构蛋白质组学等关键领域的进步。
  6. 将人工智能集成到蛋白质组学的工作流程中可以加速数据分析和生物学解释。
  7. 我们讨论了蛋白质组学在单细胞分析和空间分析中的应用,这些分析可以提供前所未有的对细胞异质性和组织结构的见解。
  8. 最后,我们审视了蛋白质组学从基础研究向临床实践的转变,包括体液中的生物标志物发现以及实施基于蛋白质组学的诊断的前景和挑战。
  9. 本综述提供了蛋白质组学现状的广泛而高层次的概述,以及其潜在的革命性意义,能够改变我们对生物学的理解和医学实践。

Main

Para_01
  1. 蛋白质组学是研究生物系统中所有蛋白质的学科,它是与基因组学、转录组学和代谢组学一起构成生物医学研究的基础,并提供了对细胞功能和疾病机制的独特见解。
  2. 作为生物功能和表型的直接效应器,蛋白质组反映了遗传倾向、环境因素和生活方式影响之间的复杂相互作用。
  3. 虽然基因组学和转录组学告诉我们细胞的潜力,而代谢组学关注下游的小分子,蛋白质组学直接调查细胞内外的功能机制。
Para_02
  1. 尽管基因组学在过去20年一直是研究的核心,但蛋白质组学的重要性变得越来越明显。
  2. 蛋白质水平复杂性的增加是由于选择性剪接、不同的翻译速率、翻译后修饰(PTMs)和蛋白酶解切割。
  3. 由此产生的蛋白质组反映了遗传、生活方式和环境之间的相互作用,并提供了结构、信号传递、转运和催化功能,这些功能与它所处的即时条件相适应。
  4. 这种复杂性需要专门的方法来进行全面的蛋白质组分析。
Para_03
  1. 在研究蛋白质组的方法中,基于质谱的蛋白质组学已成为一种强大且多功能的工具。
  2. 与基于亲和力的方法不同,基于质谱的蛋白质组学可以直接识别和定量氨基酸序列,在各种条件下提供无偏见、系统的蛋白质表达、修饰和相互作用分析(方框1)。
  3. 其优点包括无与伦比的定量准确性、特异性和适用于所有生物体的普遍适用性,而无需特定的结合试剂或先前的系统知识,除了已测序的基因组外。
Para_04
  1. 最近的技术进步克服了许多以前的限制,包括蛋白质组的完整性表征、工作流程的稳健性、通量和样品数量要求。
  2. 这些改进扩展了蛋白质组学的研究范围,从大量分析扩展到单细胞研究和空间谱分析,提供了对细胞异质性和组织结构的深刻见解。
Para_05
  1. 这篇综述提供了当前基于质谱的蛋白质组学工作流程的广泛但不详尽的概述,突出了自我们上次回顾该领域以来的关键技术改进和新兴能力。
  2. 我们探讨了结构蛋白质组学、翻译后修饰、单细胞和空间分析以及体液分析的应用。
  3. 我们还讨论了蛋白质组学从基础研究向临床实践的转变,包括实施基于蛋白质组学的诊断所面临的剩余挑战。
  4. 贯穿全文,我们强调了人工智能(AI)在数据分析和解释中的变革性影响,并以对蛋白质组学研究未来令人兴奋的方向的展望作为结论。

[div_box]

The technology of MS-based proteomics

Para_01
  1. 典型的基于质谱的蛋白质组学工作流程包括四个主要阶段:(i)蛋白质提取和酶解为肽;(ii)通过色谱法分离肽;(iii)电喷雾电离随后对肽(MS1)及其片段(MS2)进行质量分析;(iv)计算数据分析(图1)。近年来,这些阶段中的每一个都取得了显著进展,大大提高了蛋白质组学分析的灵敏度、通量和稳健性。
  2. Recent advances in each of these stages have markedly improved the sensitivity, throughput and robustness of proteomic analyses.

Fig. 1: Basic MS-based proteomics workflow, highlighting technological advances.

- 图片说明

◉ 蛋白质从包括单细胞、组织和体液在内的样品中提取,并使用特定的蛋白水解酶消化成肽。◉ 在多重分析时,这些肽通过化学方法用稳定同位素标记的标签进行标记。◉ 样本制备过程的自动化提高了蛋白质组学分析的稳定性和通量。◉ 然后,标记或非标记的肽混合物经过先进的LC分离,包括微柱阵列柱(µPAC)和预形成梯度的LC。◉ 分离后的肽在不同的保留时间(RT)从LC系统中洗脱出来,并进行DDA或DIA分析用于发现应用,或者针对非发现应用如临床检测进行靶向MS分析。◉ 所描述的质谱硬件包括最新的混合仪器,如timsTOF和Astral仪器,它们结合了被困离子迁移率分离或Orbitrap与飞行时间质量分析器,以促进增强的蛋白质鉴定和定量。◉ 该工作流程应用于探索蛋白质相互作用网络并实现全面的生物体蛋白质组研究,将分子数据与生物学功能和疾病机制联系起来。

Para_02
  1. 样本制备已经看到了显著的自动化和标准化。
  2. 96孔板格式下的平行处理和液体处理机器人使得高通量、可重复的工作流程成为可能,并且只需要最少的人工干预。
  3. 消化珠等新方法解决了去垢剂去除的挑战,这对于完全蛋白质溶解而不干扰质谱分析至关重要。
  4. 即使是对甲醛固定石蜡包埋(FFPE)组织和考古样本的有效分析现在也成为可能,这扩展了可访问样本类型的范围。
Para_03
  1. 液相色谱(LC)分离,在蛋白质组学工作流程中历史上一直是一个瓶颈,现在已经显著改善。
  2. 从纳升流速转变为微升流速增强了鲁棒性,而没有过度损害灵敏度,这得益于现代质谱仪的灵敏度提高。
  3. 使用预形成梯度的Evosep One系统就是这一趋势的体现,它允许每天分析30到100多个样品,并且具有高重现性。
  4. 另一个创新是μPAC芯片系统,它用通过微光刻技术制造的芯片柱取代了填充柱,确保了实验室间的一致肽保留时间。
  5. 因此,我们现在有了非常稳健的蛋白质组学工作流程,准备走出专门的实验室。
Para_04
  1. 质谱仪技术继续以惊人的速度发展。
  2. 尽管轨道阱分析器仍然很普遍,
  3. 飞行时间(TOF)分析器也经历了一次令人印象深刻的复兴。
  4. timsTOF仪器使用平行积累-连续裂解(PASEF)技术,
  5. 通过离子迁移率分离和浓缩肽离子,
  6. 以增加被测序的离子百分比。
  7. Astral分析器是一种多反射飞行时间分析器,
  8. 它与轨道阱结合用于MS1分析。
  9. 一旦离子进入初始四极杆,它几乎可以无损地检测到,
  10. 这使得分辨率和灵敏度都非常出色,
  11. 代表了质谱技术的又一飞跃。
Para_05
  1. 数据获取策略已经发展以解决常规数据依赖获取(DDA)的局限性。
  2. 数据独立获取(DIA)已经变得突出,它在整个电荷质量范围内选择连续窗口,并在每个循环中对所有肽进行片段化。
  3. 这种方法还与离子迁移率兼容,克服了DDA的随机性,减少了运行之间的缺失值。
  4. 相反,光谱比DDA中的复杂得多,必须与经验或预测的肽库进行评分。
  5. 先进的算法,通常使用机器学习或深度学习,极大地提高了对复杂DIA光谱的解释,有时将肽识别量几乎翻倍。
  6. 为了实现精确的定量,完成所选质量范围一个循环的时间应该足够短,以便至少在洗脱肽峰上产生四个数据点,理想情况下接近十个。
  7. DIA现在已成为大多数应用的首选方法。
Para_06
  1. 新的DIA扫描模式,如滑动窗口方法,有望提供比DDA更纯净的碎片光谱,并同时提供跨越洗脱峰的多次测量的优势。
  2. 尽管这些创新尚未广泛可用,但它们对于探索‘暗蛋白质组’——未被标准数据库记录的蛋白质或肽形式,将特别有价值。
  3. 这包括验证交替剪接蛋白的表达,识别意外修饰以及在压力条件下检测非规范翻译产物。
  4. 此外,这些技术将推动肽组学领域的发展,该领域涵盖了MHC I/II类结合或其他具有生物活性的肽。
Para_07
  1. 也就是说,DDA仍然被广泛用于各种小规模蛋白质组学实验,如亲和纯化的样品以及用于蛋白质结构分析的交联样品。
  2. 基于DDA的蛋白质定量使用等重标签——特别是串联质量标签(TMTs)——仍然是主要的定量技术,在这种技术中现在可以将多达32个样本直接进行比较。
  3. 数据分析直观,但应使用狭窄的前体选择或额外的MS3片段化阶段来避免无关肽或同位素进入相同的报告通道,这可能会扭曲定量比率。
Para_08
  1. 靶向蛋白质组学对于临床应用仍然至关重要,可以对特定肽进行敏感和绝对定量。
  2. 现在,它可以被扩展到每天使用短液相色谱梯度在一个仪器上测量数百个样本,并且在一个运行中针对数千种肽。
  3. 我们相信,是时候为该领域提供一个全蛋白质组的重蛋白资源了,这将极大地有利于工作流程独立的绝对定量以及快速独立地验证具有特殊生物学或临床重要性的蛋白质。
Para_09
  1. AI正在革新蛋白质组学工作流程的每个方面。
  2. 深度学习算法能够准确预测肽在整个蛋白质组学工作流程中的行为,增强了鉴定和定量的信心;例如,预测肽洗脱时间的顺序或预测哪些肽是蛋白质特异性肽。
  3. AI在提取生物标志物候选物和促进结果的生物学解释中也扮演着关键角色。
  4. 集成大型语言模型(如ChatGPT)有望进一步加速数据分析和假设生成,因为它们拥有涵盖生物学和医学的非常大的知识库。
  5. 此外,大型语言模型可以被教导与用于蛋白质组学中的统计工具协同工作,并基于知识图谱,从而减少幻觉的发生。
  6. 这些技术进步已经将基于质谱的蛋白质组学转化为一个强大、高通量和高度敏感的分析平台。
  7. 通过前所未有的深度、准确性和稳健性来分析微量样本,为从单细胞研究到大规模临床试验的生物研究和临床应用开辟了新的途径。

Applications of MS-based proteomics

Para_01
  1. 上述基于质谱的蛋白质组学技术的进步显著扩展了其在生物学和医学研究领域的应用。
  2. 本节探讨了蛋白质组学在理解生物学和医学方面的主要贡献领域。

Expression proteomics

表达蛋白质组学

Para_01
  1. 理解蛋白质组如何响应疾病的风险因素(包括生活方式、基因变异、环境毒素和感染)的变化,可以为治疗药物和伴随诊断的发展提供信息。
  2. 表达蛋白质组学,即大规模研究不同条件或细胞类型下蛋白质丰度变化的研究,变得越来越全面和定量,并提供了与转录组互补且不同的信息。
  3. 在人类细胞系中,尖端技术现在可以在最少的测量时间和样品量下量化超过10,000种蛋白质组。
  4. 增加前期的分级分离产生了包含超过13,000种蛋白质组的近乎完整的蛋白质组,这表明常见的细胞系至少表达了人类20,000种蛋白质编码基因中的70%。
  5. 这些研究还揭示了细胞系蛋白质组与其他组织相比非常相似,但其组织对应物则不然。
  6. 此外,蛋白质组实际上成为了细胞功能状态的一个紧密代理。
  7. 人类蛋白质组计划发现了90%的所有蛋白质编码基因的蛋白水平证据,验证并扩展了我们对表达基因组的理解。
  8. 质谱法证实了小的未注释开放读码框的存在,这些读码框曾被核糖体图谱预测,并表明它们有时作为蛋白质复合物的调节因子发挥作用。
Para_02
  1. 转录组和蛋白质组之间的关系已经被深入研究。
  2. 蛋白质组学和转录组学测量的准确性提高应该通过减少独立实验噪声来增加报告的相关性,但这似乎没有发生。
  3. 相反,在许多动态情况下,如发育或疾病进展过程中,转录组和蛋白质组调控是不同的。
  4. 分泌蛋白代表了另一个转录组-蛋白质组相关性通常较低的领域;这些蛋白质在循环系统和微环境中起着关键作用,并且可以通过蛋白质组学直接测量。
  5. 染色质蛋白质组学和全球蛋白质周转的研究有助于弥合转录组学和蛋白质组学之间的差距。
Para_03
  1. 转录组学和蛋白质组学都可以估计拷贝数,蛋白质通常比相应的转录物多出100倍或更多的拷贝数,尤其是在有丝分裂后的组织中。
  2. 虽然转录物通常平均每细胞少于一个拷贝,但功能蛋白即使对于酵母中的极低丰度复合物也至少每细胞有30个拷贝,在哺乳动物细胞中则超过100个。
  3. 蛋白质组显示出比转录组更高的动态范围——最低表达的蛋白质与最高表达的蛋白质之间的差异。
  4. 转录组到蛋白质组的偏差反映了通过合成、降解和翻译后修饰对蛋白质丰度的复杂调控,突显了直接测量蛋白质组对于理解细胞功能的重要性。

Interaction proteomics

交互蛋白质组学

Para_01
  1. 蛋白质作为细胞纳米机器,通过与其他蛋白质、RNA52、DNA60,61、代谢物和小分子药物62的相互作用执行特定功能。
  2. 绘制这些相互作用图谱对于理解生物或疾病背景下的细胞过程至关重要。
  3. 基于质谱的蛋白质组学已经彻底改变了我们全面进行这一工作的能力,得益于分析灵敏度、通量、深度和速度的技术发展。
Para_02
  1. 当与现有的质谱仪结合时,传统的亲和纯化方法已经提供了显著的见解。
  2. 一个典型的例子是最近对酵母相互作用组的基本完整的阐明,这为真核生物的蛋白质相互作用景观提供了前所未有的视角。
Para_03
  1. 邻近标记技术——使用生物素或其他化学标记方法——补充了传统的拉下法方法。
  2. 这些方法能够捕捉动态的和条件特异性的蛋白质-蛋白质相互作用,将相互作用定位到特定的结构域或识别依赖于PTM的相互作用。
Para_04
  1. 生物化学的进步进一步扩展了相互作用蛋白质组学的能力。
  2. 例如,通过CRISPR–Cas9介导的系统性敲除研究,对426种蛋白质进行了研究,以了解它们在HIV生命周期中的病毒复制和蛋白质网络中的作用65。
  3. 这些研究为理解复杂的生物系统提供了见解。
  4. 将这些技术与高通量样本处理相结合,在最近的流行病和大流行病中,包括COVID-19和寨卡病毒感染中,对于破译感染机制至关重要。
  5. 并且在识别有希望的疫苗或治疗靶点方面也发挥了关键作用66,67。
Para_05
  1. 将人工智能,特别是像AlphaFold-Multimer68这样的工具,与相互作用蛋白质组学数据整合在一起,正在进一步扩展我们从这些实验中能够学到的知识边界。
  2. 这些工具可以预测多聚复合物中的相互作用界面,为蛋白质组学数据提供结构背景,并指导进一步的实验设计。

PTMs

PTMs

Para_01
  1. PTMs 在调节蛋白质功能、定位和相互作用方面发挥着关键作用,对细胞过程、疾病机制和治疗干预具有深远影响。
  2. 基于质谱的蛋白质组学已成为发现和量化 PTMs 的首选工具,最近的技术进步大大提高了 PTM 分析的深度和广度。
Para_02
  1. 当前的 PTM 分析工作流程通过自动化富集步骤、引入离子迁移率分离和提高仪器灵敏度得到了极大的改进。
  2. 现在已经有稳健的方法可以阐明常见 PTM 的模式,如磷酸化、泛素化和乙酰化。
  3. 研究人员现在可以量化特定氨基酸上定位的数万个 PTM,从而深入了解细胞信号网络及其对刺激或抑制剂响应的动力学。
Para_03
  1. 尽管大多数方法测量PTMs的相对变化,但获得关于修饰程度的化学计量信息变得越来越重要。
  2. 这可以通过量化修饰和未修饰的肽来实现,揭示了PTM调节动力学的关键见解。
  3. 例如,研究表明,在细胞周期进程、信号转导和与衰老相关的退化等关键细胞过程中,泛素化和磷酸化具有连续性。
  4. 此外,已经很清楚的是,平均磷酸化化学计量通常相对较高——例如,在昼夜节律中——而泛素化的一般化学计量通常非常低。
Para_04
  1. 该领域也在识别和表征负责书写、阅读和擦除PTMs的酶方面取得了显著进展。
  2. 已经发现了成千上万种这样的分子,每一种都在调节蛋白质化学和功能活动方面发挥着特定作用,无论是健康状态还是疾病状态下。
  3. 理解这些酶与其底物之间的复杂相互作用仍然是一个挑战,但这是一个AI方法有望提供创新解决方案的领域。
  4. 机器学习已经成功地优先考虑了成千上万个可能具有功能性的磷酸化位点中的哪些可能是重要的,AlphaFold提供的结构预测已经在大规模上得到应用。
  5. 大型语言模型(LLMs)已经被微调来预测PTMs。
Para_05
  1. 先进的技术将使我们能够研究复杂的翻译后修饰如糖基化和氧化修饰。
  2. 改进的工作流程将解决分析罕见翻译后修饰、组合修饰以及大规模谱系分析以满足系统生物学目的所面临的挑战。

Structural proteomics

结构蛋白质组学

Para_01
  1. 结构蛋白质组学旨在帮助大规模阐明蛋白质的结构和动力学,补充传统的结构生物学技术。
  2. 已经开发了几种基于质谱的方法,每种方法都能提供独特的见解。
Para_02
  1. 氢氘交换质谱法(HDX-MS)是一种经典技术,通过测量蛋白质在氘富集溶剂中短暂孵育时暴露的酰胺氢同位素交换所导致的质量差异来实现86,87,88,89。
  2. 严格的方法和指南使这些实验成为可能90,并且已经实现了转化应用,包括抗体与抗原相互作用的研究以及蛋白质药物稳定性的研究91。
Para_03
  1. 交联质谱法(XL-MS)近年来取得了显著进展。
  2. XL-MS 使用化学交联试剂共价连接在链接器限定距离内的相邻氨基酸残基,并通过液相色谱-质谱法识别残基间的连接。
  3. 这提供了关于结构域和序列间距离的信息。
  4. 尽管解释交联数据具有挑战性,解决相互作用网络的错误,开发可富集的交联剂和新软件如xiSearch和Scout,以及应用AI工具如AlphaFold-Multimer和AlphaLink将有助于获得结构洞见并开发蛋白质相互作用调节剂。
Para_04
  1. 有限蛋白酶解通过利用蛋白质复合物中的暴露蛋白酶切割位点提供高水平的结构信息。
  2. 这包括通过蛋白质结构变化后蛋白酶切割位点的特异性改变以及蛋白质和小分子的结合所提供的特定位置信息100。
  3. 这种方法已被应用于研究脑脊液中与年龄相关的蛋白质组和结构变化,提供了对与衰老和疾病相关的蛋白质构象变化的见解101。
Para_05
  1. 整合结构蛋白质组学数据与其他结构生物学技术,例如冷冻电子显微镜(cryo-EM),可以提供对蛋白质复合物的见解。
  2. 例如,PTM 图谱结合冷冻电子显微镜帮助解析无法仅归因于氨基酸的结构模型中的未知密度。

Chemoproteomics

化学生物学

Para_01
  1. 化学蛋白质组学,即在蛋白质组学范围内系统地分析蛋白质与小分子之间的相互作用,已成为药物发现和靶点识别不可或缺的工具。
  2. 最近各种方法的改进扩大了我们绘制蛋白质与小分子相互作用图谱的能力。
Para_02
  1. 活性依赖性蛋白质谱分析(ABPP)已成为化学生物学中的基石技术。
  2. 它使用化学探针设计来结合并富集特定的蛋白质类别或家族,从而允许在复杂的蛋白质组中直接研究酶的活性。
  3. ABPP 已被广泛用于研究激酶、蛋白酶和水解酶等酶家族,提供了对其功能和作为药物靶点潜力的宝贵见解。
Para_03
  1. 热蛋白谱分析(TPP)代表了另一种强大的化学生物学方法。
  2. TPP 使用热变性来识别小分子的直接蛋白质靶标。
  3. TPP 已被证明特别有助于阐明已知药物和新化合物的作用机制,有助于目标解卷积并预测脱靶效应。
Para_04
  1. 去蛋白质降解筛选研究的进步为治疗干预开辟了新的途径,特别是在‘不可成药’靶点方面。
  2. 利用基于质谱的蛋白质组学来针对特定底物和E3泛素连接酶,研究人员已经鉴定出能够选择性地使蛋白底物泛素化以进行降解的分子,同时避免脱靶活性。
Para_05
  1. 化学蛋白质组学的力量在与其他‘组学’数据,如基因组学和转录组学结合时得到进一步增强。
  2. 随着该领域的发展,它有望扩展可药物化蛋白组并加速新型治疗策略的发现。

Single-cell proteomics

单细胞蛋白质组学

Para_01
  1. 单细胞转录组学在定义新细胞类型方面的成功引发了对单细胞蛋白质组学的巨大兴趣,后者可以提供单个细胞功能状态的直接读数。
  2. 然而,单个细胞中的蛋白质含量有限(通常为 50-500 皮克)给基于质谱的分析带来了重大挑战。
  3. 请注意,与转录组学不同,蛋白质组学无法放大所测量的数量;但是,对于每个表达的基因,蛋白质的量通常是信使 RNA 的 100 倍以上,并且这些蛋白质能更好地反映细胞间的差异。
Para_02
  1. 样本制备、质谱仪和数据采集方面的进展已经开始克服这一严峻的灵敏度挑战(图2a)。
  2. 开创性的方法涉及在纳升液滴中裂解和蛋白酶解少量细胞,然后直接加载到分析柱上109,110。
  3. SCoPE(单细胞蛋白质组学)方法的引入,该方法使用等重标记将单个细胞与载体通道结合,使得能够量化大约1000种蛋白质跨越100个单细胞111。

Fig. 2: Single-cell and spatial proteomics.

- 图片说明

◉ 单细胞和空间蛋白质组学技术的进步。a, 单细胞蛋白质组学方法从纳升液滴工作流程开始,其中单个细胞被封装用于蛋白质组分析,到更复杂的系统,这些系统集成了微流控技术进行细胞裂解和蛋白质消化。◉ SCoPE2 技术将单细胞蛋白质组学与稳定同位素标记的条形码结合,以提高灵敏度和通量,而无标签的方法则在定量准确性和可扩展性方面表现出色。◉ b, 组织空间蛋白质组学方法,包括 DVP 和扩张蛋白质组学,可用于绘制组织切片中的蛋白质组图谱,揭示生物结构和功能异质性。◉ LCM,激光捕获显微切割。

Para_03
  1. 微流控技术在提高超灵敏质谱单细胞分析方面显示出潜力。当用于分离和处理单个细胞时,它识别出每个循环肿瘤细胞中有1,500种蛋白质。
  2. 减少LC流速导致了成比例的质谱信号增强,使得使用timsTOF SCP仪器在单个HeLa细胞中无需多重化即可量化细胞周期中的多达2,000种蛋白质成为可能。
Para_04
  1. DIA已经成为单细胞蛋白质组学的数据获取模式的首选,克服了与等重标记方法相关的污染和比例失真问题。
  2. 最近的发展——例如在Astral质量分析器上的多路复用DIA和窄窗口DIA(nDIA)——进一步推动了这一技术,能够在‘一尖端’设置中量化超过5,000种蛋白质,从而消除了样本损失。
  3. 同样地,微流控仪器中的proteoCHIP EVO允许对极小体积的样品进行自动化处理,从而最小化样本损失。
Para_05
  1. 单细胞中有许多更多的蛋白质副本而不是转录本意味着它们不受泊松噪声或散粒噪声的影响。
  2. 这有可能使单细胞蛋白质组学能够使用比转录组学少得多的细胞来定义细胞状态。
  3. 随着通量的迅速提高和单个细胞中蛋白质拷贝数高于转录本,蛋白质组学可能在单细胞组学领域发挥关键作用。
Para_06
  1. 随着技术不断进步,与其他单细胞分析方法(如转录组学和代谢组学)的整合有望提供对细胞状态和功能更全面的理解。
  2. 现在,从同一单个细胞中同时进行转录组和蛋白质组分析已成为可能,这为细胞生物学提供了前所未有的洞见。

Spatial proteomics

空间蛋白质组学

Para_01
  1. 尽管单细胞方法提供了关于细胞异质性的有价值的信息,但它们通常缺乏组织内的空间背景。
  2. 空间蛋白质组学旨在通过表征蛋白质组的同时保留空间信息来弥合这一差距,从而提供有关组织结构和细胞间相互作用的重要见解。
  3. 技术进步大大扩展了我们进行空间蛋白质组学分析的能力,基于蛋白质组学能够轻松分析FFPE组织和新鲜冷冻组织的能力(图2b)。
Para_02
  1. 一种开创性的方法是深度视觉蛋白质组学(DVP),它结合了组织切片成像与人工智能驱动的细胞分类和显微切割,随后对特定细胞类型和状态进行深入的蛋白质组分析。
  2. 该方法的有效通量很高,并且同一组织背景下不同细胞类型和状态之间的功能差异很容易解释。
  3. DVP 的强大功能已经在转化研究中得到展示。
  4. 例如,DVP 最近被用于揭示导致一种致命药物诱导的皮肤疹(称为中毒性表皮坏死松解症(TEN))的关键分子改变,发现 JAK-STAT 信号通路的过度激活是关键驱动因素。
  5. 这一发现导致了一种已批准抑制剂的成功重新定位,治愈了这种状况,展示了空间蛋白质组学在个性化医学中的潜力。
Para_03
  1. 其他创新方法正在推动蛋白质组学分析的空间分辨率的边界。
  2. 组织扩张技术与蛋白质组学结合使用,使得对亚细胞结构的研究成为可能,例如来自小鼠肝细胞的单个细胞核121。
  3. 使用通过定制的三维打印技术创建的微支架,已经能够以高空间分辨率生成组织切片的完整蛋白质组图谱122。
Para_04
  1. 先进显微技术的整合,包括高plex成像、人工智能驱动的图像分析和深度蛋白质组学特征分析,有望为组织内蛋白质的空间组织提供关键见解。
  2. 这些技术的结合有望革新我们对组织生物学、疾病过程以及细胞和亚细胞水平药物反应的理解。

Bringing proteomics to the clinic

Para_01
  1. 将蛋白质组学从研究实验室转化为临床实践,对于改善疾病诊断、预后和治疗选择具有巨大潜力。
  2. 体液通过易于获取的样本为我们提供了了解患者健康状况的窗口。
  3. 由于与所有器官接触,血浆长期以来一直被视为多种疾病潜在生物标志物的宝库。
  4. 然而,其极端的动态范围——从最丰富的蛋白质如白蛋白到最不丰富的蛋白质如细胞因子,跨度超过十个数量级,给分析带来了巨大的挑战。
  5. 技术的进步大大提高了我们探测血浆蛋白质组的能力。
  6. 目前基于质谱的蛋白质组学工作流程常规测量单次注射分析中的300至500种蛋白质。
  7. 例如,使用液体处理设备、Evosep HPLC系统和timsTOF质谱仪的工作流程能够快速分析1,612个样本,成功发现了脓毒症的生物标志物。
  8. 使用Astral质谱仪,这一数量增加到每天高达100个样本的通量下约1,000种蛋白质,使得成功应用于临床队列成为可能。
  9. 血浆蛋白质组学已经显示出比现有的新冠疾病(参考文献129)、早期肝病(参考文献125)和代谢综合征(参考文献126)的临床测试更好,证实了其革新诊断的巨大潜力。
Para_02
  1. 研究人员已经使用了各种策略来增加蛋白质组深度,以充分利用血浆蛋白质组学的潜力。
  2. 新的非特异性富集策略补充了传统的去除高丰度蛋白质的方法。
  3. 利用表面蛋白冠状物的珠基工作流程,当与Astral结合使用时,现在可以识别血浆中的数千种蛋白质。
  4. 然而,仔细验证是至关重要的,以确保此类方法适用于定量、稳健的生物标志物发现和常规临床应用。
  5. 同样地,从血液中分离外泌体或微囊泡,这已经被证明对分析核酸和脂质具有优势,可能为特定组织类型的蛋白质组提供窗口。
  6. 尽管如此,这些方法及相关方法的劳动密集性质和变异性可能是采用的障碍,需要基于机器人的高通量方法来解决。
Para_03
  1. 成本仍然是临床实施的重要因素。尽管有些工作流程每份样本的成本高达数百美元,但最近的创新提供了更经济的替代方案。
  2. 例如,高氯酸沉淀工作流程保持了可重复性和稳健性,并将蛋白质组覆盖率提高到1600种或更多蛋白质,同时最大限度地减少了批次效应并大幅降低了成本。
  3. 这种生物化学协议还能够在几周内对数千个样本进行高通量分析,这对于充分有功率的临床血浆研究以及临床环境中蛋白质组学的广泛采用至关重要。
Para_04
  1. 与基于质谱的蛋白质组学不同,基于亲和力的方法(如Olink和SomaLogic)已被用于大规模人群的蛋白质数量性状位点(QTL)分析。
  2. 评估在整个样本基质中使用的结合剂的特异性至关重要,尤其是因为已经观察到主要结合剂平台之间存在有限的相关性。
  3. 使用基于质谱的方法进行正交验证对于解决这一局限性至关重要。
Para_05
  1. 除了血浆外,其他体液在临床蛋白质组学中也引起了关注。
  2. 尿蛋白组学在根据严重程度对COVID-19进行疾病分类138和根据基因型对帕金森病患者进行分层139方面显示出前景。
  3. 由于其非侵入性特点,它特别适用于儿科应用,例如诊断阑尾炎而无需让儿童接触CT扫描中的腹部辐射140,或者监测早产儿而不必通过血液采样冒贫血的风险141。
  4. 脑脊液和眼泪蛋白质组学为阿尔茨海默病等神经性疾病提供了有价值的见解,提供了比血浆更接近且更具疾病特异性的替代方案142。
Para_06
  1. 尽管一些关于MS的研究确定了可以适用于经典ELISA格式的生物标志物,但它们通常需要将基于MS的蛋白质测定引入临床。
  2. 这些面板可能包含十几个以上的标志物,每个标志物的相对变化幅度较小。
  3. 我们预计在未来五到十年内,基于MS的肽测定法,使用内部标准进行绝对定量,将在临床医学的生物标志物发现和诊断中发挥重要作用。
Para_07
  1. 蛋白质组学研究人员已经分析了数十年的组织样本。例如,于2011年启动的临床蛋白质组肿瘤分析联盟(CPTAC)已经对超过1500个样本和10种癌症类型进行了蛋白质基因组和翻译后修饰变化的特征描述,揭示了新的见解,包括蛋白质组亚型的识别、驱动突变的优先排序以及癌症相关信号通路和翻译后修饰的阐明。
  2. 它还在几个临床中心推动了标准化工作的开展,并促进了多组学整合。
Para_08
  1. 组织活检是临床诊断的另一个基石,大多数分析目前集中在形态变化、基因突变或基于抗体的蛋白质评估上。
  2. 基于质谱的蛋白质组学的最新进展使得从活检规模的组织样本中进行蛋白质组学成为可能,与临床环境中对活检标本进行的基于RNA的测试相比,这扩展了诊断或预后的能力。
  3. 基于质谱的蛋白质诊断的主要障碍不是技术性的,而是更多地与临床界对蛋白质组学技术进步缺乏认识有关。
  4. 此外,在体外诊断(IVD)需要严格的质量控制措施,而目前,大多数基于质谱的实验是在研究实验室而不是在IVD认证的临床实验室中进行的。
  5. 也就是说,目前正开发有前景的目标导向的基于质谱的蛋白质测试(图3)。
  6. 图3未翻译。

Fig. 3: Development of clinical assays from discovery proteomics.

- 图片说明

◉ 这是一个从发现到实际应用的临床蛋白质组学检测方法的流程。◉ 它始于生物标志物的发现(左侧),使用数据采集技术如DIA和DDA,随后是AI驱动的模型构建和验证。◉ 中间部分展示了临床检测方法开发的步骤,包括靶向质谱方法,强调了对准确性、线性和精确性的要求。◉ LDTs表示实验室开发的测试。◉ 右侧部分展示了这些检测方法在实际环境中的应用,详细介绍了多中心队列研究和前瞻性临床试验的纳入情况,从而展示了从研究到临床诊断的转变。

Para_09
  1. 注意大多数基于组织的蛋白质组学研究仅报告了从有限数量的回顾性标本中发现的潜在新型蛋白生物标志物143,144,150,151,并且没有在临床环境中进一步开发或验证。
  2. 尽管一些研究已经报告了对所选蛋白质的深入机制研究,并在一个或几个独立队列中验证了蛋白生物标志物或面板,但很少有研究进展到成为临床上可用的测试。
  3. 这一过程需要实际应用部署,而目前的文献中明显缺乏这一点。
  4. 基于DDA和DIA的发现蛋白质组学可能由于复杂且昂贵的研究仪器而难以成为有效的且经济上可接受的临床测试。
  5. 相反,某种形式的目标蛋白质组学,辅以适当的合成标准品,可能是更可靠且可以被临床和监管环境接受的方法149。
  6. 样本稳定性是基于质谱的蛋白质测试的重要考虑因素,而对于基于亲和力的蛋白质和基于RNA的测试而言,这是一个更大的问题,但对于基于DNA的测试来说,通常不那么关键。
  7. 如果单一蛋白质生物标志物对医学指征有效,那么可能更倾向于使用定制的免疫组织化学(IHC)为基础的测试。
  8. 然而,在大多数情况下,需要将几种蛋白质生物标志物组合成一个计算模型,这需要精确的定量,而这是IHC无法提供的。
  9. 鉴于不同MS工作流程的强度值不可直接比较,这样的模型可能会被限制在特定的仪器上,除非使用了加入的标准物质。
  10. 尽管用于蛋白质组学研究的多种MS仪器可供选择,但目前适合用作临床检测的医疗设备的选择有限,尽管它们确实存在用于测量代谢物和药物。
  11. 随着许多技术障碍的克服,现在越来越清楚的是,队列和研究的正确设计对于获得可推广的生物标志物面板至关重要。
  12. 例如,基于质谱的蛋白质组学数据集经常用于生物标志物研究时严重不足。
  13. 原则上,要求原始数据存入档案可以实现荟萃分析来测试和更好地支持生物标志物的发现。
  14. 然而,必须实施更好的手段来链接非识别的临床数据与原始文件,以避免违反隐私法规。

Outlook and the role of AI in proteomics

Para_01
  1. 基于质谱的蛋白质组学正在快速发展,这得益于持续的技术进步以及尖端计算方法的整合。
  2. 这些创新将继续推动蛋白质组学的发展。
  3. 样本制备、色谱、质量分析器和数据获取策略的进步将使从越来越小的样品中获得更深入的蛋白质组覆盖成为可能。
  4. 日益自动化和简化的流程将使蛋白质组学更加普及,使其更容易被更广泛的研究社区接受,并促进跨学科合作。
  5. 最新一代质谱仪器的高昂成本部分被其通量所抵消,但必须解决这一问题以促进更广泛的采用。
Para_02
  1. AI将在蛋白质组学中发挥越来越中心的作用(图4)。
  2. 深度学习算法将推动数据获取和解释方面的改进,从而提高蛋白质组学数据的深度和质量,同时在实验过程中实现实时决策。
  3. 11,44 是参考文献标识,在翻译结果中未体现。

Fig. 4: AI empowers MS-based proteomics.

- 图片说明

◉ AI在增强基于质谱的蛋白质组学中的应用是多方面的。◉ AI可以帮助实验规划;使用机器人进行样品制备;数据分析;数据获取;解析复杂数据集;预测PTM(翻译后修饰);以及整合蛋白质组学数据与其他组学数据。◉ 这些应用最终将促进全面的生物医学研究和复杂的数据分析。

Para_03
  1. 解释复杂的蛋白质组学数据仍然是一个挑战,而人工智能和机器学习技术将是至关重要的。
  2. 从肽和蛋白质鉴定到结构阐明,人工智能将促进从庞大的蛋白质组学数据集中提取生物见解。
  3. 将人工智能与结构生物学和网络分析相结合有望对蛋白质复合物、相互作用及其功能意义有一个全面的理解。
Para_04
  1. 在临床应用中,安全和隐私是首要关注的问题,因此能够本地运行的高能力‘开放权重’大型语言模型是一个受欢迎的发展。
  2. 这些模型——特别是最近推出的‘推理模型’——可能有助于数据解释,并且能够在保持医疗环境中所需保密性的同时处理大量数据。
Para_05
  1. 蛋白质组学与其他组学学科一样,正在寻求利用大量数据训练的大规模语言模型或‘基础模型’,这些模型显示出‘涌现特性’的理解能力。
  2. 我们预计很快会出现从光谱到氨基酸序列翻译的模型。
  3. 更雄心勃勃地,如果拥有足够的蛋白质组学数据——特别是扰动蛋白质组学数据——则可能开发出嵌入有关细胞底层生物学知识的基础模型。
  4. 尽管单细胞转录组学界已经在探索这种方法,但蛋白质组学的定量和功能性质最终可能会使其成为此类模型的更有潜力的候选者。
Para_06
  1. 结合蛋白质组学、基因组学、转录组学和代谢组学有望对生物系统进行全面理解。
  2. 由人工智能和高级计算方法促进的多模态数据分析将阐明复杂的分子网络,揭示生物分子之间的相互作用及其功能后果。
  3. 这种全面的方法将为系统生物学提供新的基础,并将在阐明疾病机制的复杂性以及识别新的治疗靶点方面发挥重要作用。
Para_07
  1. 随着蛋白质组学的成熟,努力使其这项强大的技术普及以及建立社区驱动的标准将是至关重要的。
  2. 开源软件、共享数据仓库和协作计划将促进知识传播,并使世界各地的研究人员能够充分利用蛋白质组学的潜力。
  3. 标准化实验协议、数据格式和分析流程将促进数据整合、可重复性和跨研究比较,最终加速科学发展。
Para_08
  1. 基于质谱的蛋白质组学的未来充满了令人兴奋的可能性。
  2. 我们很高兴这种潜力也在该领域之外得到越来越多的认可——这体现在中国计划大规模投资π-HuB(人体蛋白质组导航)项目上。
  3. 通过利用技术创新、计算进步和跨学科合作的协同效应,蛋白质组学将继续推动我们对生物系统理解的边界。
  4. 这一进展将为变革性的生物医学发现和转化应用铺平道路。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • Abstract
  • Main
  • The technology of MS-based proteomics
  • Applications of MS-based proteomics
    • Expression proteomics
    • Interaction proteomics
    • PTMs
    • Structural proteomics
    • Chemoproteomics
    • Single-cell proteomics
    • Spatial proteomics
  • Bringing proteomics to the clinic
  • Outlook and the role of AI in proteomics
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档