Basic Information 英文标题:Human proteome distribution atlas for tissue-specific plasma proteome dynamics 中文标题:人类蛋白质组分布图谱用于组织特异性血浆蛋白质组动态研究 发表日期:15 May 2025 文章类型:Resource 所属期刊:Cell 文章作者:Erik Malmström | Johan Malmström 文章链接:https://www.sciencedirect.com/science/article/pii/S0092867425002867 Highlights Para_01 构建了来自21种组织和8种细胞类型的蛋白质和RNA分布图谱 开发了一种全球标签评分,以客观确定蛋白质与组织的关联 该资源可以推断血液血浆蛋白质组的组织来源 能够在疾病期间增强对器官富集蛋白面板的定量分析 Summary Para_01 血浆蛋白质组由周围器官和细胞的蛋白质流入和流出维持。 为了量化不同器官和细胞在健康和疾病状态下对血浆蛋白质组的影响程度,我们开发了一种基于质谱的蛋白质组学策略,以推断在人类血浆中检测到的蛋白质的组织来源。 我们首先构建了一个来自18个血管化器官和血液中最丰富的8种细胞类型的广泛的人类蛋白质组图谱。 该图谱与之前的RNA和蛋白质图谱相结合,客观定义了全蛋白质组的蛋白质-器官关联,以推断其来源并实现血浆中器官特异性蛋白质的可重复定量。 我们证明了该资源可以确定六种独立患者队列(包括败血症、胰腺炎和心肌损伤)中的疾病特异性定量变化的器官富集蛋白质组。 该策略可以扩展到其他疾病,以推进我们对导致血浆蛋白质组动态变化的过程的理解。 Graphical abstract Keywords plasma proteome; mass spectrometry; tissue damage; organ dysfunction; biomarkers; tissue origin; tissue protein; plasma proteome dynamics; human proteome atlas Introduction Para_01 对人类蛋白质组的持续编目揭示了组织会产生由组织富集蛋白和在许多不同细胞和组织中普遍产生的蛋白质组成的组织特异性蛋白质库。 这些蛋白质库协调了不同器官和器官系统中执行的组织特异性和基本细胞功能。 与组织和细胞不同,血浆中没有蛋白质合成。 相反,血浆蛋白质组的组成是由周围细胞和器官的蛋白质流入和流出维持的。 Para_02 根据起源和功能,先前的报告表明,血浆蛋白质组中的蛋白质可以大致分为两类。一类是由肝脏产生的大量血浆蛋白,它们参与了血浆的主要功能,如提供胶体渗透压并通过补体和凝血系统维持止血。例如人血清白蛋白、载脂蛋白、急性期蛋白以及补体和凝血系统的蛋白质。 另一类数量更多但通常含量较少的是不参与血液血浆主要功能的组织蛋白。这些蛋白质来自周围的细胞和器官,作为正常周转的一部分。疾病或损伤可能会导致细胞或组织受损,导致组织蛋白泄漏到体液(如血浆)中,这些蛋白可以用作疾病诊断和预后的生物标志物。 显著的例子是心肌肌钙蛋白和胰腺α-淀粉酶,其中血浆浓度的增加分别用于诊断急性心肌梗死和胰腺炎。 此外,在动物模型中的研究表明,富含组织的蛋白质在疾病期间会发生丰度变化,并可用于评估器官功能障碍。 目前,关于人类受试者在健康和疾病状态下细胞和组织蛋白渗入血浆的性质和动态的系统性研究仍然缺失。 Para_03 在此,我们创建了一个覆盖主要人体组织和血液细胞的人类蛋白质组分布图谱。 我们将基于质谱的蛋白质组分布图谱与之前发表的三种人类蛋白质或RNA图谱合并,生成了涵盖29种不同人体组织和血液细胞的蛋白质和转录本丰度的综合基线图谱。 利用这一图谱,我们证明了周围组织对血浆蛋白质组有特定贡献,并且在疾病(如心肌损伤、胰腺炎和败血症)等病理事件中,组织富集蛋白的组成会发生变化。 Results Construction of a blood-plasma-centered tissue and cell distribution atlas 构建以血浆为中心的组织和细胞分布图谱
Para_01 作为起点,我们收集了18种健康组织,并从每个器官和细胞类型的三个或更多个体中分离出8种细胞类型,以研究深入分析组织和细胞蛋白质组是否可以用于推断在血浆中可检测到的蛋白质的来源(图1A)。 这些器官和细胞的选择基于其对血浆蛋白质组的影响可能性,并包括所有主要的血管化器官和血液中最丰富的细胞类型。 组织活检是从患有局部疾病的健康组织、健康志愿者或在预防性或重建手术期间收集的(有关更多详细信息,请参见STAR方法部分)。 细胞是从健康志愿者的血液样本中使用特定于细胞的分离协议分离出来的。 通过流式细胞术确定细胞纯度(图S1)。 图片说明
◉ 图1. 样本和实验策略的概述 (A) 预测对血浆蛋白质组有很大影响的器官和细胞从每个器官和细胞类型至少三个个体中收集或分离。◉ (B) MS实验设计的示意图概览。组织和细胞被均质化并通过SDS-PAGE进行分馏,然后以DDA模式进行LC-MS/MS分析以构建光谱测定文库。◉ 未分馏的组织和细胞样本使用DIA-MS重新分析,生成了156个蛋白质组图谱,并利用光谱文库提取蛋白质的身份和数量(称为HATLAS)。◉ (C) 组织或细胞标签分配策略的示意图概览。◉ (D和E) HATLAS蛋白质组图谱中所有已识别蛋白质的结果UMAP图,突出显示了蛋白质-组织关联。◉ 颜色表示不同的标签分配(单一标签、多标签或常见)。对所有组织分配的蛋白质进行了功能富集分析,并显示了一部分组织的结果(E)。◉ 颜色代表不同的组织,符号大小表示观察到的成功次数,例如该注释簇中的蛋白质数量。另见图S2。
图片说明
◉ 图 S1. 流式细胞术分析和细胞分选策略概述,与STAR方法相关(A-G)显示分离的血细胞的流式细胞术分析和细胞分选策略的图像。◉ 这些图像展示了分离的血细胞的流式细胞术分析和细胞分选策略。
Para_01 所有样品均经过制备用于质谱分析,随后进行离线分馏,并使用数据依赖性采集质谱(DDA-MS)对分馏后的样品进行分析,此外,未分馏的样品还通过数据非依赖性采集质谱(DIA-MS)进行了分析。 所有质谱数据均与人类蛋白质组进行比对,生成的数据被组装成一个包含10,786种蛋白质的光谱库。 为了定量分析,使用生成的光谱库查询DIA-MS数据以评估蛋白质丰度(图1B)。 总共在1%的假发现率下定量了9,827种独特的蛋白质。 Para_02 先前的研究观察到,许多蛋白质在多个组织中产生,尽管数量不同,这使得蛋白质-组织关联的分类变得具有挑战性。 为了客观地分类蛋白质-组织关联,我们首先使用均匀流形近似和投影(UMAP)将组织中鉴定的蛋白质投射到二维潜在空间中。 接下来,我们使用加权高斯核密度估计(KDE)来估计信号密度,以构建一个500×500像素的图像,每个器官都有一个单独的通道表示(图1C)。 然后对每个像素的强度进行缩放,并根据每个器官的信号贡献将单个像素分类为单一组织、多组织或共有(详见STAR方法部分的详细信息和参数)。 同样的策略也应用于细胞蛋白质。 超过90.5%的所有已鉴定蛋白质在图谱之间共享,表明细胞和组织蛋白质组之间有相当大的重叠(表S1和S2)。 使用这种策略,我们将5,108种和4,396种蛋白质分别分类为带有单一标签的组织或细胞富集蛋白。 此外,还鉴定出1,290种和2,195种蛋白质为多标签组织或细胞蛋白质。 最后,3,390种和2,351种蛋白质被归类为共有蛋白,因为它们在多个细胞和组织中表现出相似的丰度特征。 通过这种方式,可以在分析的器官中具有相似丰度特征的蛋白质可以被分配到相应的细胞或组织,如图1D所示。 Para_03 为了估计标签分配的准确性,我们对具有相同组织分配的蛋白质进行了功能富集分析。细胞和器官标签在与相应器官功能匹配的生物功能中得到富集,例如心脏或肌肉中的收缩蛋白、肝脏中的药物代谢(细胞色素P450酶)以及大脑中的蛋白质相关突触信号传导(图1E;表S3)。 此外,该策略使我们能够识别几种已知与组织相关的组织富集蛋白质,如心肌肌钙蛋白、胰腺淀粉酶和肺表面活性相关蛋白(图S2)。 图片说明
◉ 图 S2. 在 HATLAS 蛋白质组图谱中鉴定出的具有高组织和细胞特异性的蛋白质,与图 1 相关。HATLAS 蛋白质组图谱中具有高 (A) 组织特异性和 (B) 细胞特异性的蛋白质示例。◉ 在 HATLAS 蛋白质组图谱中鉴定出的具有高组织和细胞特异性的蛋白质,与图 1 相关。
Para_03 这些结果表明,结合综合DIA-MS组织图谱与我们的(UMAP/KDE)分类策略,能够无偏地定义组织-蛋白质关联,扩大了在病理条件下可以监测的蛋白质数量。 A global distribution atlas of the human proteome 人类蛋白质组的全球分布图谱
Para_01 为了创建跨多个图谱的蛋白质分布的更深层次的共识图,并确保可信标签的传播,我们从先前发表的RNA和蛋白质图谱下载了原始数据,并将其与我们的细胞和组织蛋白质组图谱整合。 合并后的图谱包括4个组织图谱(2个蛋白质和2个RNA)和2个细胞图谱(1个蛋白质和1个RNA),涵盖了21种不同组织和8种血细胞中的总共18,388个转录本和12,846个蛋白质。 这六个图谱在这里被称为HATLAS组织、HATLAS细胞(我们的蛋白质组图谱)、EMBL组织、EMBL细胞、MSP(蛋白质)和MSR(RNA)。 为了给所有图谱分配组织标签,我们使用上述相同的UMAP/KDE分类策略重新分析了下载的数据(表S1,S2和S4-S7)。 通过这种方法,每个图谱中的所有蛋白质被分类为单一组织或细胞、多种组织或细胞,或常见。 为了整合每个图谱的标签信息,我们使用以下方法构建了一个全局标签分数(GLS):只有在图谱中被识别出的蛋白质才会获得标签分数。 因此,每种蛋白质最多可以接收六种独立的标签分配(单一标签、多标签或常见)。 每个标签被赋予一个标签分数,其中单一和常见的标签注释权重高于多标签注释。 从各个图谱得出的标签分数相加,得到每个蛋白质的GLS。 具有最高GLS的组织或细胞标签被用作主要注释(详见STAR方法部分)(图2A)。 图片说明
◉ 图2. 人类蛋白质组的全球分布图谱(A)在UMAP投影上使用KDE为每个图谱(称为HATLAS、EMBL、MSP和MSR)分配组织-蛋白质/RNA标签。每个分析物根据相应图谱中的组织或细胞分配获得加权标签分数。每个蛋白质的标签分数相加得到一个全局标签分数(GLS),具有最高GLS的组织或细胞被用作主要注释。◉ (B)显示每种组织GLS水平的条形图。◉ (C)热图展示了在每种GLS水平下组织富集蛋白质的平均丰度。◉ (D)脑富集蛋白质在每种GLS水平下的归一化蛋白质强度分布。柱状图代表各图谱中平均丰度,误差线表示标准误。◉ (E)不同GLS水平下脑富集蛋白质的功能富集分析。颜色代表不同的GLS水平,节点大小表示富集途径中识别出的蛋白质数量。◉ (F)基于全球分布图谱的蛋白质-组织分配综合网络。节点表示分配的组织富集蛋白质,其大小反映了每个组织中的蛋白质数量。边和不同颜色代表从各个图谱中指定的多标签蛋白质,并按颜色编码。◉ (G)在全球分布蛋白质组图谱中具有高GLS和组织特异性的蛋白质示例。另见图S3。
Para_01 GLS 的范围从 0 到 4,反映了给定蛋白质-组织分配的置信度。 GLS 为 4 的蛋白质分配突出了那些被所有图谱自信且独立地标记到单一组织的蛋白质(见图 2G 和表 S8)。 高置信度的蛋白质约占总组织分配的 5%。 剩余 95% 的蛋白质并未在所有图谱中一致地分配到同一组织。 相反,它们被一到三个图谱分配到特定组织,强调了整合多个图谱以获得可靠结果的重要性(图 2B)。 大多数情况下,GLS 较低的分析物仅在一到两个图谱中被识别。 为了评估不同 GLS 蛋白质的组织特异性水平,我们计算了每个 GLS 级别(1-4)在组织中的平均丰度,并可视化这些蛋白质和转录物的强度如何分布在分析的组织中(图 2C)。 该分析表明,GLS 较低(1-2)的蛋白质主要在其各自的组织中产生。 在所有组织中,GLS 较高的蛋白质倾向于比 GLS 较低的蛋白质更特异于其相应的组织。 例如,我们展示了所有 GLS 级别中脑部富集蛋白质在所有组织中的平均丰度(图 2D 和 S3)。 图片说明
◉ 图 S3. 每个GLS水平的心脏富集蛋白的定量分布,与图2相关。每个GLS水平的(A)心脏、(B)肝脏、(C)肺、(D)甲状腺和(E)肾脏富集蛋白的归一化蛋白质强度分布。条形图表示每个图谱中的平均丰度,颜色表示GLS水平,误差线表示标准误。◉ 条形图代表每个图谱中的平均丰度,颜色指示GLS水平,误差线表示标准误。
Para_01 为了探索与不同GLS水平相关的生物学功能,我们对每种GLS水平的组织富集蛋白进行了功能富集分析。 对于脑富集蛋白,结果如图2E所示。 值得注意的是,即使GLS较低的蛋白质通常也富含组织特异性功能,并且在高GLS蛋白质组之间观察到相当多的富集通路重叠。 这些结果表明,组织富集蛋白的丰度范围从特定于一种组织类型的特异性产生到更适度富集的蛋白质,这些蛋白质通过使用来自一个个体的一种组织样本的一种实验方法更难以挑选出来。 Para_02 我们平均在每个器官中识别出261种组织富集蛋白。大脑和肝脏拥有最多的组织富集蛋白,分别为1,392和788种蛋白,而前列腺和膀胱的组织富集蛋白数量最少,分别为59和20种。 在细胞类型中,中性粒细胞(n = 765)、巨噬细胞(n = 642)和红细胞(n = 538)拥有最多的细胞富集蛋白。 为了可视化组织分配情况,我们将全球分布图谱绘制在网络图中。边表示每个图谱中的多标签蛋白,每个节点描绘了由GLS定义的组织蛋白(图2F;表S11)。 Para_03 这些结果共同表明,每个图谱提供了部分重叠的组织富集蛋白质集合,并且使用多个图谱可以增强组织-蛋白质分配的可信度。 利用多个图谱对蛋白质来源进行分类,可以更全面、更稳健地定义分子在组织和细胞中的分布。 Data-driven definition of primary plasma proteins 基于数据驱动的主要血浆蛋白定义
Para_01 主要在血浆中发挥功能的蛋白质,如凝血蛋白和补体蛋白,主要由肝脏产生。 对于这一组蛋白质,这里称为主要血浆蛋白,可以预期其在肝脏中的RNA水平很高,但蛋白质水平较低,因为这些蛋白质在翻译后会主动分泌到血浆中。 我们包含RNA和蛋白质丰度数据的全球分布图谱提供了一个以数据驱动的方式定义主要血浆蛋白的机会。 利用全球分布图谱,我们选择了RNA图谱中有肝脏标签的蛋白质,并去除了GLS (>3) 较高的肝脏蛋白质,以选择那些主要在肝脏中转录但不在肝脏蛋白质组中大量存在的蛋白质。 对于剩余的蛋白质,我们计算了它们在肝脏中的平均丰度,并与其他组织中的丰度进行了比较,以评估肝脏的相对丰度比率。 然后我们分析了RNA图谱和蛋白质图谱之间的差异,这使我们能够识别出在RNA图谱中比蛋白质图谱中肝脏丰度比率高5-10,000倍的蛋白质。 其中,有126种蛋白质在健康个体队列的血浆中用至少2个肽定量(图3A)。 这些主要血浆蛋白中的典型蛋白质包括凝血因子、补体蛋白、白蛋白、载脂蛋白和急性期蛋白(表S12)。 功能富集分析显示,这些主要血浆蛋白参与了血浆的主要功能,如补体和凝血级联反应、急性期反应以及胰岛素生长因子(IGF)转运的调节(图3B)。 图片说明
◉ 图3. 一种基于肝脏中RNA和蛋白质水平之间丰度的数据驱动策略来定义主要血浆蛋白(A)该点图显示了在RNA图谱中与蛋白质图谱相比,肝脏丰度比至少高5倍的126种蛋白质。◉ (B)水平条形图显示了定义的主要血浆蛋白的功能富集分析。◉ (C和D)(C)散点图和(D)小提琴图显示了所有个体和不同时间点的所有定量组织富集蛋白、常见组织蛋白和主要血浆蛋白的计算方差。◉ 红色圆点表示主要血浆蛋白。◉ 浅色圆点表示组织富集蛋白,深蓝色表示定义为常见的蛋白。
Para_01 由于主要血浆蛋白是主动分泌到血浆中的,而不是细胞坏死或正常周转的结果,我们推测它们受到比组织富集蛋白更严格的体内平衡控制。 为了验证这一点,我们使用了上述健康志愿者的时间分辨血液血浆样本。 在这个队列中,从10个人身上每周采集一次样本,共采集5次,并使用DIA-MS进行分析。 根据上述定义,我们计算了所有个体和不同时间点的量化组织富集蛋白、共同存在的组织蛋白和主要血浆蛋白的方差。 该分析表明,不同个体之间的时间变化高于单个个体内的变化,表明血浆蛋白质组在一段时间内相对稳定。 此外,主要血浆蛋白的蛋白质水平方差低于共同存在和组织富集蛋白,表明这一蛋白组受到更严格的体内平衡控制。 总体而言,基于数据驱动的主要血浆蛋白定义,可以更好地监测血浆中的组织来源蛋白。 此外,这些结果表明,在正常生理条件下,几种在血浆中可检测到的组织富集蛋白的个体间变异高于主要血浆蛋白。 Pathological changes of tissue-specific protein signatures in plasma 血浆中组织特异性蛋白质特征的病理变化
Para_01 定义的组织富集蛋白和数据驱动的主要血浆蛋白定义为监测病理条件下血浆蛋白质组动态变化提供了新的可能性。 为了验证这一点,我们在急诊科(ED)收集了三个不同概念验证患者队列的血浆样本。 这些队列包括胰腺炎患者(n = 14 + 10)、心肌梗死(MI)患者(n = 25 + 25)以及具有不同微生物病因的感染患者(n = 47 + 40),以及各自的对照组(图4A-4C)。 这三种情况有不同的潜在病理生理学和已建立的临床生物标志物,如肌钙蛋白T、淀粉酶和C反应蛋白(CRP)(图4A-4C)。 使用DIA-MS分析血浆样本,并使用组织图谱光谱库提取蛋白质强度,生成了包含161个DIA-MS蛋白质组图谱的综合数据集。 图片说明
◉ 图4. 血浆中组织或细胞蛋白特征的病理变化(A-C)在急诊科入组的胰腺炎、心肌梗死和感染队列及其相关临床生物标志物(淀粉酶、肌钙蛋白T和C反应蛋白)的概述。所有患者的血浆样本均使用DIA-MS分析,通过光谱库提取蛋白质强度,生成了161个DIA-MS蛋白质组图谱。所有蛋白质的来源是通过全球分布图谱推断出来的。◉ (D)堆叠条形图显示了胰腺炎血浆队列(对照组与胰腺炎组)中八个胰腺富集蛋白质的标准化蛋白质丰度。◉ (E)条形图说明了相对于健康对照组,在胰腺炎血浆中显著升高的四种胰腺富集蛋白质的丰度模式。◉ (F和G)使用所有鉴定出的血浆蛋白质或仅使用由全球分布图谱定义的GLS为4的胰腺富集蛋白质过滤后的胰腺炎队列的均匀流形近似和投影(UMAP)。◉ (H)条形图显示了在不同组织中鉴定出的五种心脏富集蛋白质的平均丰度水平。◉ (I)条形图说明了相对于对照血浆,在心肌梗死血浆中显著升高的三种心脏富集蛋白质的丰度模式。◉ (J和K)(J)条形图显示了一部分嗜中性粒细胞富集蛋白质的平均丰度水平,(K)以及这些蛋白质在细菌感染患者血浆中的平均丰度模式与病毒感染相比。◉ (L和M)(L)条形图显示了选定的巨噬细胞衍生蛋白质的标准化平均丰度水平,(M)以及它们在血浆中的丰度模式(病毒感染与细菌感染对比)。◉ (N和O)(N)条形图说明了所有细胞类型中富集蛋白质的标准化平均丰度,(O)以及它们在感染血浆队列中的平均丰度水平(病毒感染相对细菌感染)。◉ 误差线表示标准误,对于指定的比较进行了Mann-Whitney检验。p < 0.05;p < 0.01; p < 0.001。另见图S4和S5。
Para_01 总共在胰腺炎队列的血浆样本中鉴定出35种胰腺富集蛋白。这些蛋白质在不同组织中的标准化丰度模式如图S4所示。 其中,有13种蛋白质的GLS为4,因此被所有4个图谱确定地分配到胰腺。 两种蛋白质的GLS为3,14种蛋白质的GLS为2。 总计有11种蛋白质,包括淀粉酶α 2A(AMY2A)、胰脂肪酶(PNLIP)和羧肽酶B1(CPB1),在胰腺炎患者的血浆中显著高于健康对照组(图4D和4E)。 基于所有鉴定出的血浆蛋白质对患者队列进行分层显示,整个血浆蛋白质组无法将胰腺炎患者与其各自的对照组区分开来(图4F)。 然而,针对GLS为4的胰腺富集蛋白的数据驱动过滤,显著改善了胰腺炎患者与对照组之间的区分(图4G)。 图片说明
◉ 图 S4. 胰腺炎血浆队列中鉴定的胰腺富集蛋白,与图 4 相关。一个条形图说明了不同组织中蛋白质平均丰度。这些蛋白质被分类为胰腺富集蛋白(GLS > 1)并在胰腺炎血浆队列中鉴定。◉ 每个条形代表一种蛋白质及其平均丰度,误差线表示平均值的标准误差(SEM)。
Para_01 第二个队列由因胸痛入急诊科的患者组成,包括有和没有心肌梗死的患者。 心肌梗死组的肌钙蛋白T水平较基线升高(图4B)。 在这个队列中,全球分布图谱能够识别血浆中的24种心脏富集蛋白,并且这些蛋白在不同组织的所有图谱中的平均丰度模式如图4H所示。 与对照组相比,心肌梗死患者的血浆中有五种心脏富集蛋白显著升高,包括肌红蛋白(MB)、脂肪酸结合蛋白、心脏型(FAB3P)和含有三部分基序的蛋白54(TRIM54)(图4I)。 有趣的是,MB、FAB3P和TRIM54已经被提议作为心脏生物标志物。 Para_02 在最终的患者队列中,我们纳入了由不同微生物病原体引起的感染患者(n = 47例病毒性感染,n = 40例细菌性感染)。 先天免疫系统构成了抵御感染的第一道防线。 中性粒细胞、巨噬细胞和血小板是先天免疫系统中的关键细胞参与者,并且对于协调早期宿主对入侵病原体的反应至关重要。 为了靶向和监测细胞衍生蛋白,我们使用基于细胞的图谱来识别特异性富集于中性粒细胞、巨噬细胞和血小板中的蛋白质组。 图4J显示了一部分中性粒细胞蛋白在不同细胞类型中的平均丰度水平。 这些蛋白质,包括抵抗素(RETN)、组织蛋白酶G(CTSG)和脂质运载蛋白2(LCN2),在细菌感染期间的血浆中相对于病毒感染显示出显著更高的丰度(图4K)。 类似的模式也见于巨噬细胞衍生的蛋白质(图4L),其中约有20种巨噬细胞富集的蛋白质在细菌感染患者的血浆中显著升高(见图4M中的例子)。 相比之下,血小板衍生的蛋白质(图4N)与中性粒细胞和巨噬细胞相比表现出不同的血浆蛋白质组丰度谱型。 例如,前血小板碱性蛋白(PPBP)、血小板因子4(PF4)和糖蛋白IX血小板(GP9)在细菌感染中相对于病毒感染主要表现为下调(图4O)。 这很可能是由于血小板减少症,这种症状常见于严重的细菌感染如败血症中。 Para_03 最后,为了测试组织富集蛋白特征的变化是否与特定的病理生理机制或特定条件相关,我们比较了三个患者队列中的组织和细胞富集蛋白变化(图 S5A-S5F:条形图描绘了在三个患者队列中鉴定出的血浆中各种组织富集蛋白的平均丰度模式,与图 4 相关)。 在所有疾病状态下,急性期蛋白的数量统计上显著高于各自的对照组。 这些结果是可以预见的,因为之前已有描述表明急性期蛋白在急性冠状动脉综合征期间会被动员起来,并且败血症和胰腺炎的病理生理学与全身性炎症有关。 相比之下,血浆中胰腺富集蛋白的增加与胰腺炎特异性相关。 此外,心脏富集蛋白的水平在患有心肌梗死和细菌感染的患者中显著升高,与其他队列相比更为明显。 败血症与心脏功能障碍有关,但其潜在的病理生理机制与急性冠状动脉综合征不同,这可能解释了这些观察结果。 此外,中性粒细胞富集蛋白在细菌感染中增加更多,尽管在心肌梗死和胰腺炎患者中也观察到了部分重叠。 因此,结果显示所有患者队列中组织富集蛋白丰度水平既存在共同的变化,也存在独特的变化。 图片说明
◉ 图 S5. 不同患者队列中病理血浆蛋白质组变化的比较,与图 4 相关 全球分布图谱结合了 161 个 DIA-MS 蛋白质组图谱,用于分析不同患者队列中组织富集和初级血浆蛋白特征的变化。◉ (A–F)条形图显示了三个患者队列中急性期、胰腺富集、心脏富集、中性粒细胞富集、巨噬细胞富集和血小板富集蛋白在血浆中的平均丰度模式。◉ 误差线表示平均值的标准误差(SEM),并使用 Mann-Whitney 检验对指定的比较进行了分析(∗p < 0.05;∗∗p < 0.01;∗∗∗p < 0.001)。
Monitoring of tissue-specific protein signatures in population-scale plasma cohorts 在人群规模的血浆队列中监测组织特异性的蛋白质特征
Para_01 为了进一步量化不同器官和细胞在健康和疾病状态下对血浆蛋白质组的影响,我们纳入了来自两个大型额外血浆队列的数据——一个来自英国生物银行的大规模人群队列和一个大型败血症研究。", "Sentence_02": "英国生物银行的血浆队列源于一项制药合作项目,该项目使用Olink蛋白质组学技术对54,219名英国生物银行参与者进行了血浆蛋白质组定量分析。", "Sentence_03": "败血症血浆队列是一项基于质谱的败血症研究,涵盖了1,364名败血症患者,数据是通过DIA-MS方法获得的。 Para_02 在本研究包含的所有队列中,血浆中检测到3,585种独特的蛋白质,并根据其基础GLS和蛋白质-组织分配被划分为不同的蛋白质组(图5A;表S13)。 其中,1,364种被指定为具有单一标签的组织蛋白,大约10%的这些蛋白的GLS为4。 进一步将组织或细胞富集的蛋白质细分为各自的组织和细胞类型后发现,所有包含的29个器官和细胞都对血浆蛋白质组有贡献。 然而,每个器官的贡献程度明显不同。 对于某些器官,如大脑、脾脏、肝脏、肌肉和胰腺,特定组织蛋白对血浆的贡献是其他器官(如膀胱、甲状腺和前列腺)的许多倍(数百种蛋白质),而后者仅贡献了数十种蛋白质(图5B)。 我们注意到,一般来说,具有独特蛋白质组和许多组织特异性蛋白质的大且血管化的器官对血浆蛋白质组组成的影响更为显著,相比之下,较小的器官影响较小。 图片说明
◉ 图5. 血浆中组织富集蛋白的概况(A)圆环饼图显示了血浆中所有已鉴定的蛋白质及其根据全球分布图谱分配到的全球蛋白质组的百分比分布。◉ (B)一个圆形条形图描述了血浆中识别出的组织富集蛋白,根据其基础组织分配和GLS进行细分。每个条形代表一种蛋白质,颜色表示其在相应组织中的标准化平均丰度水平。目标器官中的标准化丰度根据图例着色。◉ (C和D)点图展示了与肝功能障碍(C)和胃炎(D)相关的组织富集蛋白及其蛋白质关联(效应大小)。误差线表示标准差。这些蛋白质根据全球分布图谱中推断的来源进行分类。◉ (E)点图显示了脓毒症患者中肺表面活性蛋白B的血浆水平,其中呼吸功能障碍(SOFA呼吸评分>2)相对于没有呼吸功能障碍的脓毒症患者(SOFA呼吸评分为0)。◉ (F)我们首先选择了在血浆中检测到的肝脏和胃部富集的所有蛋白质。条形图描绘了两种图谱(HATLAS和EMBL)中蛋白质比例与其在相应器官中的强度比例之间的比较。◉ (G)在(C)中标记为"肝脏"的蛋白质的富集String网络图。每个点代表一种蛋白质,边表示从String得出的蛋白质关联。对指示的比较进行了Mann-Whitney检验。p < 0.05;p < 0.01; p < 0.001。
Para_02 英国生物银行提供了参与者的特征,包括与疾病相关的蛋白质关联,使其成为检测组织特异性蛋白质组学疾病特征变化的宝贵资源。 为了研究器官损伤的发生是否改变了组织富集蛋白的丰度,我们选择了根据其来源组织分类的蛋白质,这些蛋白质与肝功能障碍(ALT升高)和胃炎有显著正相关关系(图5C和5D)。 分析表明,与其它器官来源的蛋白质相比,128种肝脏富集蛋白和10种胃富集蛋白分别与肝功能障碍和胃炎的关联强两倍。 在败血症队列中,我们发现肺表面活性蛋白B(SFTPB),一种高度肺特异性的蛋白质,在患有呼吸功能障碍的败血症患者的血浆中显著增加,相对于没有呼吸功能障碍的败血症患者(图5E)。 Para_03 有趣的是,在血浆中检测到的组织富集蛋白中,具有GLS4的蛋白质比例比所有组织富集蛋白高出两倍。 然而,我们观察到,并非所有GLS高的蛋白质都在血浆中被检测到,这表明其他因素可能影响哪些蛋白质能在血浆中被识别。 为了研究这一点,我们选择了在血浆中检测到的肝脏和胃部蛋白质,并将其比例与相应器官中的强度进行了比较(图5F和5G)。 分析显示,在血浆中鉴定出的这些组织特异性蛋白质中有25%至30%消耗了其各自组织中约40%的强度。 这些发现表明,在血浆中检测到的组织富集蛋白在其相应的器官中通常非常丰富,因此很可能在血浆中产生更丰富的印记,这与动物模型中的先前观察结果一致。 Para_04 总体而言,结果表明所有分析的组织都对血浆蛋白质组有所贡献,生成了可用于探测器官功能障碍的组织富集蛋白面板。 本研究展示的结果表明,在疾病过程中,周围组织和细胞会改变血浆蛋白质组的组成,这可以用来定义基于血液的、疾病特异性的蛋白模式,为未来的生物标志物研究评估器官功能障碍提供资源。 Discussion Para_01 多年来,血浆蛋白质组作为了解疾病和生物标志物发现研究的来源已被广泛研究。 然而,对于周围组织和细胞如何影响血浆蛋白质组组成的不完全理解使得此类研究变得复杂。 在这项工作中,我们构建了一个蛋白质组分布图谱,以推断在血浆中可检测到的所有蛋白质最可能的起源,从而促进发现特定于组织或细胞的蛋白质特征。 Para_02 为了实现蛋白质-组织关联的客观和自动分配,我们开发了一种UMAP/KDE分类策略,该策略在根据蛋白质和RNA丰度谱将蛋白质分配到组织方面发挥了重要作用。 这种策略提供了一个灵活的数据驱动解决方案,可以根据实验问题进行调整,而不是依赖于手动规则替代方案。 为了进一步增强蛋白质-组织分配,我们将蛋白质组图谱与之前的大型目录整合,以计算每个蛋白质的GLS。 整合多个图谱的目的是最小化技术和生物变异,并构建一个跨越多种组织和细胞类型的更深层次的全球分布图谱。 大约5%的组织富集蛋白具有最高的GLS。 许多因素,如活检中的细胞组成以及个体和技术变异性,显著影响组织RNA和蛋白质丰度水平。 获得较低GLS 1-2的蛋白质由于低转录物和蛋白质丰度,通常被一个或几个图谱遗漏。 然而,这些蛋白质的功能富集和丰度分布图表明,这些蛋白质实际上仍然主要在这些分配的器官中产生,并与具有较高GLS的蛋白质具有相似的生物学功能。 这些结果强化了使用多个图谱不仅可以通过重复观察增加组织分配的信心,还可以扩展可以在健康和疾病期间监测的组织富集蛋白候选列表。 Para_03 我们预测,结合全球分布图谱和大规模基于血浆的蛋白质组学分析,将为未来研究中许多病理条件下组织蛋白如何被调控提供有价值的见解。 为此,诸如蛋白质耗竭和蛋白质富集策略等技术进步将进一步增加在血浆中鉴定出的蛋白质数量,并揭示额外的组织富集蛋白质。 此外,这里描述的全球分布图谱可以扩展到包括其他组织、细胞或分布图谱,无论技术方式如何,从而允许利用未来的科学发展。 这里提供的资源为进一步增加我们对不同病理生理过程如何扭曲健康血浆中的蛋白质组成以探索潜在病理生理机制的知识提供了起点。 Para_04 我们的研究有几个局限性。首先,用于生成蛋白质组图谱的样本量相对较小,因为每个器官或细胞类型的组织样本仅来自三个健康个体。 每个器官的样本数量较少,这使得难以解释个体差异的影响。 然而,这一局限性凸显了将我们的蛋白质组图谱与之前发表的数据集整合的重要性。 另一个局限性是,在包含的独立研究中缺乏标准化程序,例如如何收集活检样本以及采样器官的哪些部分。 这些技术差异会影响活检中的细胞组成和观察到的蛋白质水平。 第三个局限性是,由于样本量小,我们没有考虑性别、种族和年龄。 然而,我们的数据显示,组织独立聚类,表明这些因素对变异的影响较小——这一观察结果与之前一项出版物的发现一致。 另一个局限性是,将蛋白质分配给特定组织具有挑战性,因为没有蛋白质-组织分配的黄金标准。 尽管我们提出了一种解决方案,但缺乏客观定义的组织分配方法表明科学界需要制定标准化的方法。 最后,比较基于组织和基于细胞的图谱也具有难度。 单个细胞存在于不同的器官和组织中,导致广泛的蛋白质重叠。 我们的数据显示,两种类型图谱之间的蛋白质重叠率几乎达到91%。 由于我们研究中包含的细胞图谱数量有限,进一步增加了比较的复杂性。 尽管存在这些局限性,这里呈现的全球分布图谱为科学界提供了一个资源,可用于研究血浆蛋白质组组成与周围组织之间的关系,以及在疾病过程中组织特异性蛋白质面板的变化。 Resource availability Lead contact 主要联系人
Para_01 有关资源和试剂的更多信息和请求应直接联系 Johan Malmström (johan.malmstrom@med.lu.se)。 Materials availability 材料可用性
Para_01 本研究没有生成任何新的独特试剂。 Data and code availability 数据和代码的可用性
Para_01 MS 蛋白质组学数据,包括光谱库和完整的元数据表,已通过 PRIDE23 合作存储库存入 ProteomeXchange 联盟,数据集标识符为 PRIDE: PXD059640。 数据处理和分析软件可在 GitHub 上获得,并遵循 MIT 许可(https://github.com/malmstroem/gls)。 数据可以在配套的数据门户上查看和分析:https://atlas.txms.org/。 此外,原始和处理过的蛋白质组学和转录组学数据可以在以下网址查看:https://www.ukbiobank.ac.uk/、https://www.ebi.ac.uk/gxa 和 https://tsomics.shinyapps.io/RNA_vs_protein/。 其他数字资产,如软件容器,可以在以下网址下载:https://zenodo.org、https://doi.org/10.5281/zenodo.14292543 和 https://doi.org/10.5281/zenodo.14636966。 Acknowledgments Para_01 E.M.由Wenner-Gren基金会(FT2020-0003)、Birgit和Hellmuth Hertz基金会、Hedda和John Forssman基金会、Crafoord基金会以及瑞典医学协会(SLS-985287)资助。 J.M.是Wallenberg学院的研究员(KAW 2017.0271),并由瑞典研究理事会(Vetenskapsrådet,VR)(2019-01646和2018-05795)、Wallenberg基金会(KAW2016.0023,KAW2019.0353和KAW2020.0299)以及Alfred Österlunds基金会资助。 L.M.由Knut和Alice Wallenberg基金会(2016.0023)、Vetenskapsrådet(2020-02419)以及Alfred Österlunds基金会资助。 E.N.由Marianne和Marcus Wallenberg基金会、瑞典乳腺癌协会(bröstcancerförbundet)、瑞典癌症协会(Cancerfonden)、Skåne地区、瑞典国家卫生服务的研究经费(ALF)、Berta Kamprad夫人基金会、Anna-Lisa和Sven-Erik Lundgren基金会、Magnus Bergvall基金会、Anna和Edwin Bergers基金会以及Skåne大学医院的综合研究基金资助。 我们要感谢Kofi Chief Nti-Karikari-Apau帮助绘制图1A。 部分图像在BioRender.com上创建:Malmström, J. (2025) (https://biorender.com/z67g462, https://biorender.com/l54w015, https://biorender.com/r18r601, 和 https://biorender.com/s86w601)。 Author contributions Para_01 E.M.规划了项目,进行了样本制备,分析了数据,并撰写了手稿。 L.M.规划并监督了项目,实现了分析软件,进行了数据分析,参与了数据解释,开发了数据门户,并修改了手稿。 S.H.进行了样本制备,质谱分析,参与了数据分析,并修改了手稿。 T.M.进行了样本制备,参与了数据解释,并对手稿的重要智力内容进行了修改。 A.S.、C.K.和C.G.-T.进行了部分数据分析,参与了数据解释,并修改了手稿。 E.Å.、S.H.、B.T.、S.R.、P.E.、L.B.、A.F.、A.D.、M.M.、I.H.、P.K.、C.B.、E.N.、L.B.D.、J.M.和A.L.收集了组织活检/血浆样本或血液细胞分离,并对手稿的重要智力内容进行了修改。 E.N.规划并监督了项目,负责组织活检的收集,参与了数据解释,并修改了手稿。 J.M.规划并监督了项目,分析了数据,参与了数据解释,并撰写了手稿。 Declaration of interests Para_01 作者声明不存在竞争利益。 STAR★Methods Key resources table 关键资源表
Experimental model and study participant details 实验模型和研究参与者详情
Organ collection and preparation 器官的收集和准备
Para_01 人类样本的收集依赖于斯科讷大学医院和赫尔辛堡医院的普通外科、心胸外科、神经外科、手外科、妇科和泌尿科的临床前研究人员、质谱专家和外科医生之间的合作。 从至少三名个体的每种组织或细胞类型中收集了二十六种组织和细胞类型,并获得了当地伦理委员会批准的伦理许可(详见每个器官下的详细信息)和生物银行许可。 所有参与者均年满18岁,并根据伦理许可获得了知情同意。 在整个项目中,我们根据不同研究的器官或细胞类型使用了不同的伦理审批。 在某些情况下,个人数据在样本收集时被匿名化,导致性别和种族信息缺失。 总体而言,这类数据适用于大约90%的研究人群。 性别分布为55%男性和45%女性,95%的参与者为高加索族裔。 Para_02 从每个器官的不同患者中,在手术过程中收集了大约 4x4 毫米的三个刀切活检样本(最少 50 毫克;或对于外周神经,由于其直径较小,至少需要 20 毫米长)。 这些组织立即被放在冰上,并在采集后一小时内存储在 -80°C 的环境中。 这些样本是从以下外科手术过程中分离出来的。 Pancreas 胰腺
Para_01 胰腺组织是从一种称为胰十二指肠切除术的外科手术中获取的,该手术包括切除十二指肠、胰头、远端胆管和胆囊。 手术是由于胰腺恶性肿瘤而进行的。 健康的胰腺组织是从标本中的非肿瘤组织中获取的(DNR 2014/764 和 DNR 2015/668)。 , Liver 肝脏
Para_01 从一名接受良性肝囊肿切除术的患者和一名接受胰十二指肠切除术的患者中收集了肝组织(见上述描述)。 第三个样本来自一名接受结直肠转移局部切除术的患者(未接受过化疗),并从肝脏的不同部位获取了健康组织(DNR 2014/764 和 DNR 2015/668)。 Spleen 脾脏
Para_01 从两名因胰腺癌前病变而接受包括脾切除术在内的远端胰腺切除术的患者的正常脾脏中获取脾组织。 在器官获取过程中采集了一个脾脏组织样本(DNR 2014/764和DNR 2015/668)。 Heart, aortic vessel, adipose tissue and muscle tissue 心脏、主动脉血管、脂肪组织和肌肉组织
Para_01 在心脏直视手术(冠状动脉旁路移植术)过程中,收集了心外膜和中等大小血管的活检样本。 组织样本取自右心耳、左内乳动脉以及升主动脉壁,在手术过程中用于近端静脉吻合作为旁路移植物。 在同一手术过程中还采集了脂肪和肌肉组织(DNR 2014/764 和 DNR 2015/668)。 Stomach/ventricle and colon 胃和结肠
Para_01 从具有大体正常上消化道(胃镜)或下消化道(结肠镜)内镜检查的患者处取了活检样本(DNR 2014/764 和 DNR 2015/668)。 Ovaries 卵巢
Para_01 从患有遗传性乳腺癌和卵巢癌累积但没有BRCA突变的患者身上,通过手术切除了卵巢(EPN 2004/558)。 Skin 皮肤
Para_01 从健康志愿者(DNR 2014/764和DNR 2015/668)处取了一个包括真皮和皮下脂肪的5毫米皮肤穿刺样本。 Prostate and urinary bladder 前列腺和膀胱
Para_01 从接受经尿道前列腺切除术(TURP)的四名患者中获取了前列腺和膀胱的组织样本。 从膀胱侧壁和三角区取样,这些区域分别代表内胚层和中胚层来源。 四名患者中有三名已知患有前列腺癌,但病理检查未显示切除标本中有恶性肿瘤,因此前列腺样本代表良性前列腺增生。 膀胱组织是正常的(DNR 790/2005 2006-01-17)。 Kidney 肾脏
Para_01 纳入的患者接受了根治性肾切除术,包括整个肾脏的切除。 该手术通过机器人辅助方法或腹腔镜手术完成。 患者因良性嗜酸细胞瘤、乳头状肾癌或透明细胞肾癌接受手术。 健康的肾组织取自与手术原因相对的另一极。 对肾脏进行了显微镜检查,以确保健康组织没有任何疾病的影响。 Lung 肺
Para_01 从器官捐赠者处收集了健康的肺组织,根据他们的医疗记录,他们之前没有肺部疾病的病史,并通过与其最亲近的亲属的访谈进一步确认了这一点。 这项研究得到了瑞典隆德伦理委员会(FEK 91/2006)和哥德堡伦理委员会(FEK675–12/2012)的全面批准。 从远端肺标本中,按照先前描述的方法,从胸膜表面下方的位置采集样本。 Brain 大脑
Para_01 从因癫痫接受神经外科手术的其他健康患者中收集了脑组织(DNR 212/2007)。 手术包括颞叶切除术,包括海马体和部分杏仁核。 Peripheral nerve 外周神经
Para_01 从下腿的腓神经处取了长达30毫米的神经活检(手术后剩余部分;不含脂肪),这些活检样本来自原本健康的患者,他们在进行腓神经用于修复另一条受损神经的手术过程中获取了这些样本(DND 2016/5 LU,DNR 2016/98,DNR 2024-01893-0)。 Neutrophil preparation 中性粒细胞制备
Para_01 根据制造商的说明,将健康供体的全柠檬酸化人血置于Polymorphprep(Axis-Shield)上,并在20°C下以400 × g离心35分钟。 回收中性粒细胞层并悬浮于含有钙和镁的PBS缓冲液中,体积为50毫升。 在350 × g下离心10分钟后,通过低渗裂解20秒去除红细胞。 然后在20°C下以250 × g离心5分钟,重悬于Na培养基(含5.6 mM葡萄糖、127 mM氯化钠、10.8 mM氯化钾、2.4 mM磷酸二氢钾、1.6 mM硫酸镁、10 mM Hepes和1.8 mM氯化钙;用NaOH调节pH至7.3)。 细胞进一步通过荧光激活细胞分选(FACS)进行纯化(详见STAR方法部分的流式细胞术和抗体)(DNR 657/2008)。 Erythrocytes 红细胞
Para_01 将健康供体的全柠檬酸化人血分层置于Polymorphprep(Axis-Shield)上,并在20°C下以400 × g离心35分钟。 收集底部的红细胞层并洗涤三次(400 × g,10分钟)。 将细胞重悬于PBS中,并通过流式细胞术(DNR 657/2008)验证细胞纯度。 Platelets 血小板
Para_01 从健康供体采集的全枸橼酸化人血在20°C下以160 x g离心10分钟,以获得富含血小板的血浆(PRP)。 收集PRP后,进行新的离心步骤(160 x g,10分钟,20°C)。 再次回收PRP,并在20°C下以800 x g离心10分钟使细胞沉淀,然后重悬于PBS中。 重复此洗涤步骤一次。 通过以下描述的流式细胞术验证细胞纯度。 Lymphocytes and monocytes 淋巴细胞和单核细胞
Para_01 使用制造商(Axis-Shield)描述的方法,通过Lymphoprep密度离心从白细胞单位(从Reveos自动血液处理系统获得)中分离出单核细胞。 收集到的单核细胞层经过两次洗涤(400 x g,10分钟,4°C),然后重悬于PBS中。 使用FACS进一步将细胞分离成B细胞、单核细胞、CD4 T细胞和CD8 T细胞。 Macrophages preparation 巨噬细胞的制备
Para_01 从 Reveos 自动化血液处理系统获得的白细胞单位中,按照制造商(Axis-Shield)的说明,通过淋巴细胞分离液密度离心分离出人单核细胞,并经过抗 CD14 包被的微珠纯化步骤。 纯化的 CD14+ 单核细胞以每孔 100 万个细胞的密度接种在含有 10% 血清和 20μg/ml 重组人 MCSF(Peprotech)的 RPMI 1640 培养基(Life technologies)中的 6 孔板中,并培养 8 天。 细胞用 PBS 收集并制备用于质谱分析。 通过免疫荧光法使用巨噬细胞标志物抗 CD68(5μg/ml)和 CD163(2μg/ml)(Biolegend)确定巨噬细胞纯度为 85% 以上。 Bone marrow 骨髓
Para_01 骨髓穿刺样本来自健康的捐献者,在瑞典隆德的斯科讷大学医院血液科(DNR 2021-04046)收集。 骨髓捐献者的样本用PBS稀释到1:1的比例,并分层在Ficol密度梯度(GE Healthcare)上,然后在4°C下以850 g离心20分钟。 收集到的细胞在PBS中洗涤两次(450 g,4°C,每次5分钟)。 细胞重新悬浮在PBS中,并按照如下所述方法准备进行质谱分析。 Plasma preparation 血浆制备
Para_01 静脉血样本在室温下以2,000 x g离心10分钟,分离出的血浆上清液分别储存在–80°C直至分析。 Time-resolved healthy plasma cohorts 时间分辨的健康血浆队列
Para_01 从十名健康捐赠者身上在不同时间点收集了静脉血样本,如前所述。 根据伦理许可DNR 2013/314 LU,获得了知情同意。 Pancreatitis Cohort 胰腺炎队列
Para_01 来自斯科讷大学医院的十名成年急性胰腺炎患者的静脉血样本被纳入样本队列。 根据批准的伦理许可DNR 2009/413,所有患者均获得了知情同意。 急性胰腺炎定义为上腹部疼痛,淀粉酶水平至少是参考上限的三倍和/或影像学检查确认急性胰腺炎。 样本按照上述方法离心处理。 作为对照,从斯科讷大学医院急诊科收治的14名上腹部疼痛但淀粉酶水平正常的患者中收集了静脉血样本。 淀粉酶分析由斯科讷大学医院临床化学部门进行。 Myocardial injury cohort 心肌损伤队列
Para_01 从斯科讷大学医院急诊科收治的50名胸痛患者中收集了血浆样本,这些患者的肌钙蛋白T血浆水平可能升高也可能未升高。样本采集在临床化学部门进行,且未标识患者身份。 心肌损伤被认为是心脏肌钙蛋白T值高于第99百分位参考上限的情况。 Para_02 在瑞典马尔默的斯科讷大学医院临床化学系使用罗氏诊断公司的Elecsys高敏肌钙蛋白T检测(德国)在Cobas 6000分析仪(德国)上对锂肝素血浆进行了肌钙蛋白T分析。 该检测在平均浓度为16 ng/L和240 ng/L时的变异系数均为2.0%。 Infection cohort 感染队列
Para_01 从斯科讷大学医院急诊科收治的疑似感染患者中收集静脉血样本,作为先前描述的前瞻性、多中心临床试验的一部分。 在获得批准的伦理许可(DNR 2014/741 2014-11-18)下,所有患者均获得了知情同意。 选择了具有确诊但不同基础感染(40例细菌感染+47例病毒感染)的患者子集(n=87)进行进一步的质谱分析。 C反应蛋白(CRP)分析在斯科讷大学医院的临床化学部门进行。 Method details 方法详情
Flow Cytometry and Antibodies 流式细胞术和抗体
Para_01 用于流式细胞术分析和细胞分选的抗体包括:CD19-BV605(SJ25-C1,BD),CD235a-APC(GA-R2,BD),CD16b-PE(CLB-gran11.5,BD),CD34-PE(581,Biolegend),CD38-APC(HIT2,Biolegend),CD45-FITC(H130,Biolegend),CD4-APC(A161A1,BioLegend),CD8-Pacific Blue(SK1,BioLegend),CD42b-FITC(HIP1,Biolegend),CD3-PE Cy7(UCHT1,Biolegend)和CD14-FITC(63D3,Biolegend)。7-氨基放线菌素D(7AAD)用作活细胞的标志物。细胞在FACS Aria II/Aria III上进行分选。收集的数据使用FlowJo软件(Tree Star)进行分析。
Homogenization step 均质化步骤
Para_01 组织活检被切成了更小的碎片。 小块组织活检或分离的细胞与250微升PBS(Gibco)和100毫克0.1毫米二氧化硅珠(Biospec Products)混合,并使用FastPrep-96仪器(1600g,180秒)(MP BIOMEDICALS)进行匀浆。 样品经过离心(14,000g,1分钟,20°C),并移除上清液(称为SOL)后储存。 剩余的沉淀溶解在175微升PBS + 2% SDS(w/v)中,并加热到99°C持续5分钟。 通过新的离心步骤(14,000g,1分钟,20°C)去除二氧化硅珠,第二次上清液(称为SDS)被移除并储存。 两种上清液(SOL和SDS)中的蛋白质浓度均使用Pierce BCA蛋白质测定试剂盒(Thermo Scientific)测定。 SDS-PAGE analysis SDS-PAGE分析
Para_01 将匀浆器官(包括SOL和SDS组分)或细胞(仅全细胞裂解物)中的蛋白质浓度调整至100 μg,并与含有5% β-巯基乙醇(Sigma-Aldrich)的Laemmli样品缓冲液(Bio-Rad Laboratories Inc.)混合,然后在预制胶(Criterion 12+2孔梳,45 μl,Bio-Rad Laboratories Inc.)上进行电泳。 凝胶在60V电压下运行(Criterion,Bio-Rad Laboratories Inc.),直到样品开始迁移,然后电压增加到160V。 凝胶随后用GelCode Blue Stain Reagent(Thermo Scientific)染色30到60分钟,并用去离子水去除多余的蓝色染色试剂。 In gel digestion 在凝胶消化中
Para_01 从均质化的器官和细胞中提取的蛋白质在SDS-PAGE上运行,然后进行凝胶内消化。 每条泳道切成10个片段,每个凝胶片段转移到含有400 μl 100 mM碳酸氢铵(ABC,Sigma-Aldrich)的离心管中。 为了去除凝胶片段中的Gel Code Blue染色剂,移除ABC溶液,并将凝胶片段在50%乙腈(ACN,Sigma-Aldrich)和50 mM ABC中室温孵育20分钟。 弃去上清液,并向每个凝胶片段中加入100 mM ABC,随后再孵育20分钟。 重复清洗步骤,直到凝胶片段中不再检测到蓝色。 在最后的清洗步骤中,使用100% ACN脱水凝胶片段。 移除液体后,凝胶片段在speedvac(miVac Duo浓缩器,Genevac Ltd)中干燥,然后用100 mL 20 mM DL-二硫苏糖醇(DTT)(Sigma-Aldrich)和100 mM ABC在55°C下还原60分钟,接着用200 mL 55 mM碘乙酰胺(IAA,Sigma-Aldrich)和100 mM ABC在室温黑暗条件下烷基化45分钟。 凝胶片段在100 mM ABC中清洗,然后在ACN中孵育。 凝胶片段通过添加100 mM ABC再次复水,最后通过添加ACN脱水。 移除液体相后,凝胶片段在speedvac中完全干燥。 蛋白质通过在100 mM ABC中与100 mL胰蛋白酶(序列级修饰猪胰蛋白酶,10 ng)过夜孵育37°C进行消化。 肽段通过三次5%甲酸和50% ACN的提取以及最终一次100% ACN的提取获得。 收集的样品在speedvac中浓缩并重悬于20 mL HPLC水中,含有2% ACN和0.2%甲酸。 向所有样品中添加合成肽(JPT Peptide Technologies,柏林,德国),用于保留时间校准,浓度如下:1.0 pM GTFIIDPGGVIR;5.5 pM TPVITGAPYEYR;5.2 pM ADVTPADFSEWSK;2.7 pM DGLDAASYYAPVR;1.0 pM GAGSSEPVTGLDAK;2.8 pM TPVISGGPYEYR;2.9 pM GTFIIDPAAVIR;3.4 pM YILAGVENSK;2.7 pM VEATFGVDESNAK;7.7 pM LGGNEQVTR。 凝胶内消化后,肽段通过鸟枪法LC-MS/MS分析。 SMART digest SMART 摘要
Para_01 不同队列的血浆使用SMART digest试剂盒(赛默飞世尔科技)进行消化。1微升血浆用50倍体积的水稀释,然后再用4倍体积的SMART Digest缓冲液(50 mM Tris pH 7.2)进一步稀释。 样品被转移到PCR条中的SMART Digest Trypsin消化树脂中,并在70°C下以1400转每分钟的速度混合孵育4小时(使用带有ThermoTop的Thermomixer C,Eppendorf)。 通过加入2微升0.5M三(2-羧乙基)膦(TCEP,Sigma-Aldrich),并在37°C下孵育60分钟来还原半胱氨酸,随后加入4微升0.5M碘乙酰胺(Sigma-Aldrich)并在室温下孵育60分钟进行烷基化。 所得肽段使用Solaμ SPE HRP板(赛默飞世尔科技)进行脱盐处理。 SP3 beads SP3 珠子
Para_01 蛋白质溶液(来自组织和细胞的上清液 10 μg)溶解在含有 8 mol/L 尿素(Sigma-Aldrich)的 100 mmol/L 碳酸氢铵 (ABC) 中。 蛋白质用 TCEP(Sigma-Aldrich)还原,最终浓度为 5 mM,在 37 °C 下处理 30 分钟,并用 10 mM IAA(Sigma-Aldrich)在室温下避光处理 30 分钟进行烷基化。 将 10 μL 蛋白质溶液(1 μg/μL)与 2 μL 珠子混合。 珠子-蛋白质混合物(Thermo Scientific Sera-Mag Speed Beads A 和 B,CAT# 4515-2105-050250, 4515-2105-050350)通过添加 5 μL 1% 甲酸调节至 pH ∼2,然后加入 15 μL 乙腈(100 %),使总体积中的最终浓度达到 50%(v/v)。 样品在室温下孵育 8 分钟,然后在磁力架上再孵育 2 分钟。 移除上清液,随后进行两次冲洗步骤(每次使用 200 μL 70% 乙醇冲洗 30 秒),样品保持在磁力架上。 移除乙醇并加入 180 μL 100% 乙腈,孵育 15 秒。 弃去上清液并将珠子空气干燥 30 秒。 蛋白质用含有约 250 ng/μL Trypsin/rLysC 酶混合物(Promega)的 5 μL 100 mM Ambic pH 8.8 消化,总用量为 1.25 μg,在 37°C 下过夜消化 14 小时。 向每个样品中加入 100% ACN 至最终浓度大于 95%,在室温下孵育 8 分钟,然后在磁力架上再孵育 2 分钟。 样品用 180 μL 100% 乙腈洗涤。 肽段通过在含有 2% DMSO、0.1% FA 的 20 μL 溶液中孵育 5 分钟进行洗脱,随后超声处理,最后将样品转移到 MS 样品瓶中,并加入 iRT 肽(Biognosys AG)。 LC-MS/MS analysis LC-MS/MS分析
Para_01 用于光谱库生成的数据依赖性采集(DDA)测量是在连接到EASY-nLC 1000液相色谱系统的Q Exactive Plus(赛默飞世尔科技)上进行的。 肽段通过C18反相色谱分离,使用EASY-Spray柱,25厘米×75微米内径,PepMap RSLC C18 2微米,在流速为300纳升/分钟的情况下,用含0.1%甲酸水溶液中的5%至35%乙腈线性梯度洗脱120分钟。 在MS1扫描(分辨率为70,000,扫描范围为400–1200 m/z)中,允许最多15个强度最大的带电荷≥2的前体离子被碎裂并在分辨率为17,500下测量。 自动增益控制(AGC)设置为1e6,用于MS和MS/MS,离子累积时间分别为100毫秒(MS)和60毫秒(MS/MS)。 前体离子使用归一化碰撞能量为30的高能解离(HCD)进行碎裂。 Para_02 数据非依赖性采集(DIA)测量是在连接到EASY-nLC 1200液相色谱系统的Q Exactive HF-X(赛默飞世尔科技)上进行的。 肽段通过C18反相色谱分离,使用EASY-Spray柱,50厘米 x 75微米内径,PepMap RSLC C18 2微米,在0.1%甲酸水溶液中以5%至35%乙腈线性梯度洗脱,流速为300纳升/分钟,持续120分钟。 可变窗口数据非依赖性采集(DIA)方法由Bruderer等人描述。 简而言之,一次MS1扫描范围为350–1650 m/z,分辨率为120,000,自动增益控制目标为3e6,最大离子注入时间为60毫秒,随后是26次MS2扫描,分辨率为30,000,自动增益控制目标为3e6,自动离子注入时间,并采用逐步归一化碰撞能量(NCE)为25.5、27和30。 MS原始数据存储并管理在openBIS(20.10.0)中,并通过ThermoRawFileParser(1.3.1)转换为中心化的索引mzML文件。 DIA assay library DIA分析文库
Para_01 通过使用FragPipe(v18.0)按照Yu等人的协议,利用MSFragger-DIA搜索所有样本的DDA和DIA数据,构建了一个光谱库。 肽段谱图匹配(PSMs)通过Percolator进行验证,并筛选出假发现率(FDR)为1%的匹配。 蛋白质在5%的FDR下进行筛选,而肽段则在1%的FDR下通过Philosopher(v4.4.0)进行筛选。 然后,通过FragPipe使用默认参数调用Python包easypqp,将验证后的鉴定结果转换为用于DIA-NN的光谱库。 Quantitative analysis of tissue, cell and plasma samples 对组织、细胞和血浆样本进行定量分析
Para_01 DIA-NN(v1.8.1)用于分析组织和血浆的DIA样本。 鉴定结果在1%的假发现率(FDR)下进行了过滤,没有进行蛋白质推断,启用了智能分析,并且允许使用第一次通过后创建的高质量鉴定库重新分析所有样本。 DIA-NN的原始输出被传递给DPKS进行下游分析。 使用DPKS进行了归一化处理,并通过iq算法的实现对蛋白质进行了定量。 Assigning proteins to tissues for each atlas 将蛋白质分配到每个图谱的组织中
Para_01 数据使用用 Rust 编程语言开发的定制应用程序(可在 GitHub 上获得 https://github.com/malmstroem/gls)进行处理和分析。 该应用程序基于 iwf crate(https://crates.io/crates/iwf),它提供了一个灵活的框架来实现复杂的数据处理工作流程。 这种方法使我们能够简化数据处理,确保准确性和可重复性。 为了将蛋白质分配给组织,我们首先通过计算每次测量的总信号来标准化 RNA 和蛋白质图谱,如下所示:Si=∑j=1mxij,其中 m 是组织 i 中的测量次数。 然后,我们通过以下方式对数据进行归一化,以确保每个样本的 Si 相同:yij=xij·STSi,其中 ST 是:ST=∑i=1nSi,n 是图谱中的样本数量。 在不同组织中丰度差异很大,常见蛋白质或转录物存在于许多样本中,而组织特异性蛋白质或转录物只存在于一个样本中。 因此,我们使用单位和缩放方法对数据进行了缩放,如下所示:x˜ij=xij∑jxij。 Para_02 由于确定蛋白质-组织分配具有挑战性,并且有时依赖于研究问题,我们创建了一种方法,允许用户探索测量任意两种蛋白质之间距离的方法,并以2D密度图像的形式提供视觉反馈。 此外,我们允许用户指定邻近蛋白质的影响,以尽量减少底层数据中噪声的影响。 为此开发的技术解决方案依赖于UMAP,允许用户定义如何测量距离,然后通过加权KDE控制邻居的影响,具体细节如下。 Para_03 每个组织(图像中的通道)对每个像素的相对贡献计算如下:v(i,j)=I(i,j)∑k=1CI(i,j,k),其中 (i,j) 是像素位置,C 是图像中的通道数,I(i,j,k) 是通过KDE计算得到的第 k 个通道的强度。 其中 (i,j) 是像素位置,C 是图像中的通道数,I(i,j,k) 是通过KDE计算得到的第 k 个通道的强度。 Para_04 最后,我们确定每个蛋白质最近的像素,并将该蛋白质分配到相同的标签 Construction of a Global distribution Atlas 全球分布图集的构建
Para_01 全球分布图集结合了所有六个图集的数据,并将每种蛋白质分配到一个或多个组织或细胞(标记为单标签或多标签)。 此外,还有两个特殊标签:一个用于在大多数组织和细胞中大量存在的蛋白质,另一个用于主要的血浆蛋白质。 Para_02 首先,所有图谱都使用上述的UMAP/KDE分类策略独立分析。每个蛋白质/转录本从单独的图谱中获得一个标签分配(单一标签、多标签或共同标签),并且每个标签都被赋予了一个加权标签分数。 文中没有第二句话。 单标签注释(1p)的价值高于多标签注释(0.45p)。 只有在图谱中被识别出的蛋白质才会获得标签分数。 如果一个蛋白质被分配到两个或三个组织,则它被标记为多标签,例如,在多个组织中达到了相同的GLS(见下文)。"}这是最终的输出格式:json{"Sentence": "如果一个蛋白质被分配到两个或三个组织,则它被标记为多标签,例如,在多个组织中达到了相同的GLS(见下文) 如果一个蛋白质获得了三个或更多的共同标签,或者被分配到三个以上的不同组织中,则认为该蛋白质是全局表达的。 Para_03 为了整合这六个数据集,我们将各个图谱得到的标签分数相加,以获得每个蛋白质的全局标签分数(GLS)。 具有最高GLS的组织或细胞标签被用作主要注释。 Para_04 GLS 的范围是 0-4 分,反映了给定蛋白质-组织标签分配的置信度。 例如,GLS 为 4 的蛋白质分配突出了那些被所有组织图谱自信地标记为单一组织的蛋白质。 此外,GLS 还反映了蛋白质在所有图谱中被识别的频率。 分配给单一组织并且仅在该图谱中被识别的蛋白质将获得 1 分的全局标签分数,但仍然会被分类为组织富集蛋白。 Para_05 为了标记主要的血浆蛋白,我们首先选择了在RNA图谱中具有肝脏标签的蛋白质,并去除了全球标签分数大于3的肝脏蛋白。 对于这一子组的蛋白质,我们通过将这些蛋白质/转录物在肝脏中的归一化强度除以其他组织中每个组织图谱的平均归一化强度,定义了肝脏中的相对丰度比。 比较RNA和蛋白质图谱的结果使我们能够识别在基于RNA的图谱中肝脏丰度比至少高5倍的蛋白质。 在最后一步中,我们将选定的蛋白质与健康的血浆蛋白质组进行比较,识别出至少有两个肽的126种主要血浆蛋白质。 Quantification and Statistical Analysis 量化与统计分析
Para_01 Mann-Whitney 检验用于确定选定组织蛋白的统计显著性。 这些分析是在 Prism 中进行的。 Supplemental information Para_01 下载:下载电子表格(336KB)表S1. 组织HATLAS中鉴定的蛋白质及其相应的标签,与图1相关。 下载:下载电子表格(309KB)表S2. 细胞HATLAS中鉴定的蛋白质及其相应的标签,与图1相关。 下载:下载电子表格(72KB)表S3. HATLAS中定义的组织蛋白质的富集分析,与图1E相关。 下载:下载电子表格(614KB)表S4. EMBLE组织图谱中鉴定的转录物及其相应的标签,与图2相关。 下载:下载电子表格(407KB)表S5. MSP组织图谱中鉴定的蛋白质及其相应的标签,与图2相关。 下载:下载电子表格(401KB)表S6. MSR组织图谱中鉴定的转录物及其相应的标签,与图2相关。 下载:下载电子表格(508KB)表S7. EMBL细胞图谱中鉴定的转录物及其相应的标签,与图2相关。 下载:下载电子表格(11KB)表S8. 具有高GLS的选定组织富集蛋白质,与图2G相关。 下载:下载电子表格(26KB)表S9. 全球分布图谱中定义的组织富集蛋白质的富集分析,与图2E相关。 下载:下载电子表格(23KB)表S10. 全球分布图谱中定义的具有GLS1的组织富集蛋白质的富集分析,与图2E相关。 下载:下载电子表格(2MB)表S11. 全球分布图谱的概述,包括所有已鉴定的蛋白质和转录物及其相应的标签和全球标签得分,与图2相关。 下载:下载电子表格(13KB)表S12. 主要血浆蛋白的概述,与图3A相关。 下载:下载电子表格(149KB)表S13. 来自六个不同血浆队列的所有已鉴定蛋白质及其相应的全球标签和GLS,与图4和图5相关。