大脑衰老过程受各种生活方式、环境和遗传因素,以及与年龄相关的病理的影响。磁共振成像和人工智能方法在理解衰老过程中发生的神经解剖学变化方面发挥了重要作用。大规模、多样化的人口研究能够识别由不同但重叠的病理和生物因素导致的全面和有代表性的大脑变化模式,揭示受影响大脑区域和临床表型的交叉和异质性。在此,我们利用最先进的深度表示学习方法 Surreal-GAN,并展示方法学进展和大量实验结果,阐明来自 11 项研究的 49,482 名个体的大脑衰老异质性。通过各自的测量 R 指数确定并量化了每个个体的五种主要脑萎缩模式。它们与生物医学、生活方式和遗传因素的关联为观察到的差异的病因提供了见解,表明它们有可能成为遗传和生活方式风险的大脑内表型。此外,基线 R 指数可预测疾病进展和死亡率,捕捉早期变化作为补充预后指标。这些 R 指数建立了一种测量衰老轨迹和相关大脑变化的维度方法。它们有望实现精确诊断,特别是在临床前阶段,促进个性化患者管理和有针对性的基于特定大脑内表型表达和预后的临床试验。
2. 引言
人类大脑在衰老过程中会发生结构变化,但这些变化的轨迹在个体之间差异很大,凸显了大脑衰老的异质性。遗传、生活方式和疾病等各种因素的复杂相互作用导致了这种异质性,既加剧了与年龄相关的神经病理学过程,又预防了与年龄相关的神经病理学过程。此外,特定区域或空间模式的相对细微的大脑变化可以在阿尔茨海默病等神经退行性疾病的临床前阶段早期出现。因此,以具有代表性、可重复和临床可解释的方式揭示广泛个体中与衰老相关的异质性神经解剖学变化至关重要。这类研究有可能阐明潜在生物学(包括神经病理学)机制的复杂进展,尤其是与可用的直接神经病理学生物标志物相结合时。此外,它们可能为诊断、预后、脆弱性或恢复力提供有价值的早期标记,指导确定合适的干预措施。
神经影像学在研究人脑中起着关键作用,它能够直接量化体内和大规模的这些变化。这丰富了我们对衰老和疾病如何影响大脑结构和功能的理解。之前的大部分研究都依赖于病例与对照组的比较,而这种比较并非旨在解决个体和病理之间的异质性。一些机器学习方法利用二元分类,试图在个体层面上推导出大脑衰老的神经影像学生物标志物;然而,这些研究仍然忽视了潜在的异质性,只推导出典型或平均模式的不同神经解剖学变化的生物标志物。人们已经采用了各种聚类方法来从神经影像学数据中解析与衰老相关的神经系统疾病的异质性;然而,它们通常会因与衰老和神经病理学无关的大量大脑结构变化而受到混淆。此外,他们旨在将每个个体聚类为一个亚型,从而忽略了一个个体在不同阶段可能患有多种潜在病理。
与之前的方法相比,Surreal-GAN 是一种近期出现的弱监督深度表示学习方法,它提供了一种创新而通用的方法,可用于解开大脑衰老的异质性。通过学习从参考 (REF) 组(例如年轻健康个体)到目标 (TAR) 组(例如老年人或具有特定临床表型的患者)的多种转变,该模型可以捕捉到相对于参考人群的异质性大脑变化,并有效地将它们提炼为低维表示指数。这些指数(本文称为 R 指数)表示个体大脑沿多个维度变化的严重程度,可能反映了导致偏离参考大脑结构分布的潜在神经病理学和生物学过程混合的阶段。
本研究的贡献有两方面。首先,我们通过在减少的表示潜在空间中引入 R 指数之间的相关结构,大大扩展了 Surreal-GAN 方法,从而捕捉到多个(可能共存的)潜在神经病理学过程之间相互作用的萎缩表现。其次,我们将这种方法应用于来自 iSTAGING 联盟的大型、协调的多研究、多地点数据集,该数据集由来自 11 项神经影像学研究的 50,000 多名参与者组成。由于我们的目标是捕捉大脑衰老的模式,因此在我们的实验中,我们将 REF 组定义为 50 岁以下的参与者,在这个年龄,更广泛的大脑异常和影响神经系统的疾病开始出现或加速。所有其他50岁以上的人,包括患有轻度认知障碍 ( MCI ) 或痴呆症的人,都被归为 TAR 组。因此,我们建立了一个数学原理表示法,以表示该队列中神经解剖学大脑衰老的主要维度,并将这些维度与认知、临床、生活方式和遗传指标联系起来。此外,生存分析表明,这些维度上的大脑变化可以预测未来的疾病进展和死亡率。
Surreal-GAN利用深度生成模型以及一系列有效的正则化约束来学习从 REF 人群(例如衰老前或健康对照队列)的脑部测量值到 TAR 人群(例如衰老或疾病相关队列)的脑部测量值的一对多转换(方法 1)。因此,Surreal-GAN 可以捕捉与感兴趣条件相关的脑部变化的主要维度或模式,同时最大限度地减少混杂变化。脑部变化沿每个维度的表达称为 R 指数。同一个参与者可以具有不同模式的非排他性共表达,这表明多种病理过程可能处于活跃状态(图1a)。
图1. a, 异质性衰老效应导致人类大脑结构发生明显改变,从而导致各种大脑变化模式。Surreal-GAN 是一种利用生成学习的弱监督深度学习方法,它通过捕捉从 REF 群体到 TAR 群体的转变来识别归因于衰老过程的大脑变化模式。它使用多维 R 指数具体表示特定个体中此类大脑变化模式的多样性。这些 R 指数可作为不同大脑变化模式类型和严重程度的指标并对其进行量化,这些模式被认为反映了潜在的神经病理学过程及其阶段。b,在本研究中,为了解开与大脑衰老相关的神经解剖学异质性,我们分别将 REF 和 TAR 组设置为衰老前个体(<50 岁)和所有老年人(>50 岁)。Surreal-GAN 确定了五个可重现的维度,每个维度都与不同的大脑变化模式相关。进一步的统计分析揭示了与每个维度相关的一系列影响因素,包括病理影响、生活方式因素、生活事件和遗传变异。
原始 Surreal-GAN 模型的基本框架本质上鼓励了派生 R 指数之间的独立性。正如理论上所证明的那样(方法 2),这在处理相关的真实维度或大脑变化模式时会造成很大的限制。从经验上讲,我们展示了模型在半合成数据上的性能下降,其中真实模式之间的模拟关联程度不同。由于多种潜在病理共同发生及其对大脑各个区域的潜在影响,这种限制在大脑衰老的背景下变得尤为重要。在当前的研究中,我们通过在训练过程中使用高斯 copula 引入 R 指数之间相关性的参数化来解决这一限制(方法 2)。在半合成实验中,增强型 Surreal-GAN 在处理各种模拟相关性水平方面表现出色。在真实数据实验中,它有效地得出了相关的 R 指数,这些指数可以捕捉潜在病理机制之间的相互作用(图2c)。
图2. a, 每个参与者的大脑在五个维度上的衰老严重程度通过五个 R 指数 (R1–R5) 量化,这些指数揭示了与灰质萎缩相关的不同模式。通过对每个 R 指数进行的体素 t检验显示每个 R 指数的特征模式,同时调整年龄、性别、颅内容积 (ICV) 和其余四个 R 指数。进行了错误发现率 (FDR) 校正以调整多重比较,P 值阈值为 0.001。b, 五个 R 指数与 WMH 体积显示出不同程度的关联。ρ c 和 ρ分别表示调整年龄和性别后的关联。R5 显示最强的正关联。c, 五个 R 指数彼此之间表现出正的Pearson 相关性,其中 R3、R4 和 R5 之间的关联最强。d, 五个R 指数与实际年龄表现出显著的正相关性。此外,在年龄与 R1、R3 和 R5 之间的相关性 (ρ )中,男性和女性之间存在显著差异,以星号标记。此外,调整年龄后,男性和女性群体在 R 指数分布方面表现出显著差异,如 Cohen's d (男性 > 女性)值作为效应大小所示。
我们定义了训练(发现)集,包括一个由 1,150 名年龄在 20-49 岁(43.8 ± 6.6)之间的参与者(衰老前参与者)组成的 REF 组和一个由 8,992 名年龄在 50-97 岁(68.2 ± 9.1)之间的参与者组成的 TAR 组,其中包括来自 11 项研究的 MCI 或痴呆症患者(所有老年人),从而训练 Surreal-GAN 模型来得出捕捉大脑衰老模式谱的维度表示。随后,我们将生成的模型应用于所有 49,482 名年龄在 50-97 岁(65.5 ± 7.9)之间的 iSTAGING 参与者,以将大脑变化在每个维度上的表达与人口统计、临床、神经认知、生活方式和遗传指标相关联(图1b)。独立训练模型之间的一致性(方法 4)表明,最具可重复性的 R 指数来自五个维度,这五个维度也使用由 1,000 名 REF 和 4,818名 TAR 参与者组成的独立训练集进行复制。此外,我们通过专门针对男性和女性参与者训练模型,测试了五个维度在不同性别中的可重复性。性别特异性的 R 指数与一致的脑萎缩模式相关,并与原始值显示出很强的 R 指数相关性(方法 6)(男性 = 0.886,女性 = 0.849)。如下所述,性别差异仍然可以通过五种模式的表达水平差异及其与实际年龄的关系来捕捉。
我们首先使用基于体素的形态测量分析研究了与每个指数相关的神经解剖学变化。R1 与皮质下萎缩显著相关,主要集中在尾状核和壳核。R2 以局灶性内侧颞叶 (MTL) 萎缩为特征。R3 表示顶颞萎缩的严重程度,包括颞中回、角回和枕中回的萎缩。R4 以内侧和外侧额叶区域以及顶上和枕叶区域的弥漫性皮质萎缩为特征。R5 主要表示以岛叶皮质为中心的外侧裂萎缩(图2a)。此外,我们观察到白质高信号 (WMH) 体积与 R2–R5 之间存在显著的正相关关系 (图2b)。其中,无论是否调整年龄和性别,R5 都表现出比其他维度更强的关联性 ( ρ = 0.430 和ρ c = 0.245,P < 1 × 10 −200 )。5 个 R 指数彼此之间显示出显著的关联,其中 R3、R4 和 R5 之间的关联最为显著(Pearson r值 0.39–0.46;图2c )。
所有 R 指数都与实际年龄呈现出显著相关,其中 R5 与年龄的相关性最强(图2d)。相反,R1 和 R2 的相关性相对较低。调整年龄后,男性和女性组在所有五个 R 指数中都存在显著差异,其中最显著的是 R3(d = 0.171)和 R5(d = 0.178)。男性被试在各个维度上都表现出比女性更严重的脑萎缩,这从更大的 R 指数中可以看出。此外,通过 Fisher r-to-z 变换测试,我们观察到男性和女性组在年龄与 R1(P = 1.6 × 10 −4)、R3(P = 2.7 × 10 −5)和 R5(P = 7.6 × 10 −4)之间的相关性方面存在细微但显著的差异,表明性别因素可能对其产生影响。教育程度一直是理解大脑功能的重要因素;然而,我们仅观察到 R3 与教育程度之间存在显著关联,且效应值较小(P = 0.026)。因此,我们选择在后续分析中不校正教育程度。
为了研究 R 指数与慢性病风险之间的关系,英国生物样本库 (UKBB) 将一生中被诊断患有慢性病的个体分为 14 个疾病类别:MCI/痴呆、中风、多发性硬化症、高血压病、糖尿病、抑郁症、躁郁症、精神分裂症、帕金森病、慢性阻塞性肺病 (COPD)、骨关节炎、慢性肾病 (CKD)、骨质疏松症和缺血性心脏病。另外还从其他六项研究中纳入了 2,550 名参与者以丰富 MCI/痴呆队列,并从 PHENOM 联盟(通过维度神经成像评估精神病异质性)中纳入了另外 71 名(年龄相容)参与者以丰富精神分裂症队列。没有患上这 14 种疾病的 UKBB 参与者被归类为健康对照 (HC) 组。为了检验对照组和患病组之间的 R 指数差异,我们进行了多元线性回归分析,并调整了年龄和性别(图3a)。
图3. a, 调整年龄和性别后,HC 组和对应于 13 种慢性病之一的每个患者 (PT) 组之间的 R 指数分布存在显著差异(P < 6.6× 10 −4,Bonferroni 校正)。暖颜色表示较大的 Cohen's d(PT > HC)。没有颜色填充的分布表示与 HC 组(灰色)没有显著差异。b 、b, R2 –R5 指数的值与进展为 MCI 或痴呆的风险相关,如相应的 HR 所示。Cox 比例风险模型用于测试关联,并调整了年龄和性别。c, R 指数有助于提高预测疾病进展的性能。基于 b 中显示的 R 指数的重要性,我们在对基线时年龄超过 60 岁的参与者拟合 Cox 比例风险模型时,逐步将 R 指数作为特征逐一纳入。对于每种特征组合,进行了 100 次 20% 保留交叉验证迭代以得出一致性指数。d, 八位代表性参与者在 R2、R3 和 R5 中的进展路径,他们从 CN 转变为 MCI 或从 MCI 转变为痴呆症。不同的颜色代表不同的诊断。e, R5 与死亡风险显着相关,年龄和性别在 Cox 回归中作为协变量进行调整。与 c 类似,R指数逐渐被纳入交叉验证的特征,用于预测 60 岁以上参与者的死亡风险(误差线,95% CI;中心线,中位数;箱限,上四分位数和下四分位数;须,1.5×四分位距;点,异常值)。
MCI/痴呆症队列在所有五个维度上均表现出显著的高级 R 指数,其中最显著的影响是 R2(Cohen's d = 0.869,P = 4.1 × 10 −131)、R3(d = 0.849,P = 1.6 × 10 −125)和 R5(d = 0.673,P = 5.7 × 10 −81)。多发性硬化症患者在 R3(d = 0.498,P = 6.7×10 −8)、R4(d = 0.515,P = 2.4 × 10 −8)和 R5(d = 0.513,P = 2.8 × 10 −8)上表现出高级衰老。此外,精神分裂症(R3:d = 0.507,P = 2.5 × 10 −8;R5:d = 0.725,P = 2.0 × 10 −15)和帕金森病(R3:d = 0.481,P = 9.6 × 10 −6;R5:d = 0.370,P = 6.6 × 10 −4)患者的脑萎缩在 R3 和 R5 维度上更为严重,精神分裂症患者的 R2 值也更高(d = 0.566,P = 5.3 × 10 −10)。此外,R5 维度与神经精神疾病以及一组与其他器官系统相关的慢性疾病有关,包括呼吸系统、肾脏系统、代谢系统和心血管系统。在高血压、糖尿病、CKD 和缺血性心脏病这些常见合并症中,额外纠正其他三项不会导致与高血压和糖尿病的关联发生实质性变化;然而,在 R5 中,HC 与 CKD(d = 0.101,P = 0.021)或缺血性心脏病(d = 0.056,P = 0.012)患者之间的差异在统计学上不显著,这表明高血压和糖尿病是影响这些疾病患者大脑沿 R5 维度变化的主要因素。
除了探索与慢性疾病的基线关联外,我们还使用来自七项研究的2,700 名参与者的纵向数据,检查了 R 指数对未来从认知正常 (CN) 进展为 MCI 以及从MCI 进展为痴呆症的预后潜力。使用 Cox 比例风险模型测试R 指数与进展风险之间的关联,同时调整年龄和性别。 R2(P = 2.7×10−8,风险比(HR)4.50,95%置信区间(CI)2.65–7.64),R4(P = 4.5×10−3,HR 2.05,95%CI 1.25–3.37)和R5(P = 1.3×10 −4,HR 2.93,95%CI 1.69–5.09)与CN向MCI转化的风险显着相关,其中R2显示出最强的预后指标(图3b)。 R2(P = 1.1×10−26,HR 6.37,95% CI 4.54–8.94)、R3(P = 2.8×10 −19,HR 7.97,95% CI 5.07–12.54)和 R5(P = 2.2×10 −8,HR 3.70,95% CI 2.34–5.86)与 MCI 进展为痴呆的风险显著相关,其中 R2 和 R3 是主要的预后指标(图3b)。在对 60 岁以上参与者的交叉验证中,除了年龄和性别(C 指数 0.755 ± 0.033)之外,结合R2(一致性指数 (C 指数) 0.768 ± 0.031)和 R5(C 指数 0.773 ± 0.033)作为特征,可以提高对 CN 进展为 MCI 风险的预测。同样,对于预测从 MCI 进展到痴呆症,添加 R3(C 指数 0.646 ± 0.035)、R2(C 指数 0.704 ± 0.030)和 R5(C 指数 0.705 ± 0.030)可显著提高预测性能(C 指数 0.550 ± 0.034)(图3c)。此外,在图3d中,我们展示了 8 位经历疾病转变的代表性参与者的 R2、R3 和 R5 的纵向进展路径。与基线风险关联一致,这些代表性参与者在从 CN 转变为 MCI 之前表现出 R2的快速增加,在从 MCI 发展到痴呆症之前表现出 R2 和 R3 的快速增加。在被诊断为痴呆症后,一些参与者的 R5 也显著增加。
然后,我们使用类似的方法,检查了 UKBB 参与者的死亡风险(图3e)。R3(P = 1.8 ×10 −3,HR 1.95,95% CI 1.28–2.98)、R4(P = 3.2 ×10 −3 , HR 1.89,95% CI 1.24–2.87)和 R5(P = 1.3 ×10 −6,HR 2.98,95% CI 1.91–4.64)与死亡风险显着相关,其中 R5 是最重要的预后指标。在 60 岁以上的参与者中,R5(C 指数 0.672 ± 0.029)、R3 和R4(C 指数 0.674 ± 0.029)作为特征,再加上年龄和性别(C 指数 0.661 ± 0.027),可以提高死亡风险的预测,而随后添加其他 R 指数则导致预测性能略有下降。
我们进一步探讨了这五个维度与认知以及脑脊液 (CSF)/血浆生物标志物之间的关联。利用偏相关,我们首先测试了 R 指数与 ADNI 队列中的四个阿尔茨海默病神经影像学倡议 (ADNI) 综合评分之间的关联(n = 2,214),以及来自多项研究的参与者中的其他四个认知评分(n = 6,280–30,444;图4a)。我们观察到 R2、R3 和 R5 与所有认知评分之间存在一致且显著的关联,尽管关联模式在认知评分之间有所不同。具体来说,R2 与记忆表现表现出特别明显的相关性(ρ = 0.462,P = 1.8 × 10 −117,以记忆(MEM)复合材料的ADNI(ADNI-MEM)衡量),而 R3 表现出与执行功能的类似关联(ρ = 0.349,P = 9.8 × 10 −65与执行功能(EF)复合材料(ADNI-EF)和记忆(ρ = 0.343,P = 3.2 × 10 −62与 ADNI-MEM 相比)。
图4. a, 五个 R 指数与不同的认知变量具有不同的关联程度。偏相关(双侧)用于测试 R 指数与认知分数之间的关联,并根据年龄和性别进行调整。对 MMSE、DSST、TMT-A 和 TMT-B 进行了额外的站点调整,以考虑多站点数据的利用。显著相关的 R 指数以 *(P < 1.25 × 10 −3,Bonferroni 校正)标记。偏相关系数显示为条形图的中心,误差线代表 95% CI。用于得出这些系数的样本大小标在认知变量名称旁边。ADNI-MEM、ADNI-EF、ADNI-VS 和ADNI-LAN 是四个与记忆、执行功能、视觉空间功能和语言相关的 ADNI 综合认知分数。b, 在 R 指数中,R2、R3 和 R5 与从 ADNI 研究中获得的 11 种 CSF/血浆生物标志物具有显著关联(用 * 标记)(P < 6 ×10 −4)。 CSF 生物标志物标记为蓝色,血浆生物标志物标记为红色。 径向图显示相关系数的值(中心)和 95% CI(误差带)。 为了更容易可视化,我们在绘图时反转了负系数的符号(用 | ρ | 表示)。 生物标志物名称旁边的“+”和“−”符号表示正相关和负相关。 由于样本量较小,使用Benjamini-Hochberg 程序进行 FDR 校正。c,五个 R 指数与来自 UKBB 研究的一组环境/生活方式因素和生活事件显着相关(P < 8.7 × 10 −5,Bonferroni 校正)。使用了根据年龄和性别调整的偏相关,如图所示。 “*”的数量表示相关系数(图例)。正相关和负相关分别用因子名称旁边的“+”和“-”符号表示。对于所有三个图,都进行了双侧t检验以检验相关系数的显著性。MMSE,简易精神状态检查;DSST,数字符号替换测试;TMT-A/B,连线测试 A/B 部分;ADNI-VS,ADNI 视觉空间功能综合;ADNI-LAN,ADNI 语言综合。
在 ADNI 研究中收集的 232 个 CSF/血浆生物标志物中,我们发现 R 指数与生物标志物之间存在 15 个显著关联(图4b)。其中,R2 和 R3 与 CSF-pTau181 呈显著正相关(P = 1.6 ×10 −12对比 R2;P = 1.3 ×10 −14对比 R3),与 CSF-Aβ42 呈显著负相关(P = 2.6 × 10 −23对比 R2;P = 4.4 × 10 −23对比 R3),这两者都是阿尔茨海默病的标志。二元淀粉样蛋白和 tau 阳性也显示出与 R2(ρ = 0.290,P = 7.0 ×10 −28与淀粉样蛋白+相比;ρ = 0.173,P = 1.4 ×10 −10与 tau +相比)和 R3(ρ = 0.258,P = 4.1 × 10 −22与淀粉样蛋白 + 相比;ρ = 0.110,P = 4.3 ×10 −5与 tau +相比)显著相关。 R5 与一组其他生物标志物相关,包括嗜铬粒蛋白-A(P = 1.3×10 −11)、组织因子(P = 2.6×10 −7)、AXL 受体酪氨酸激酶(AXL)(P = 3.5×10 −5)、血管紧张素转换酶(P = 5.4×10 −5)、胱抑素-C(P = 1.1×10 −5)和白细胞介素 (IL)-6 受体(P = 2.4×10 −4 ),可能反映了潜在的止血和炎症机制。
我们研究了生活方式和环境因素对这五个维度变化的影响。使用偏相关,我们评估了 R 指数与 UKBB 研究中 120 个变量之间的关联,并根据年龄和性别进行了调整(图4c)。对于所有五个萎缩维度,我们发现酒精摄入量与脑萎缩具有统计学上的显着相关性。此外,吸烟状况主要与 R3 至 R5 的表达有关。值得注意的是,R4 和 R5 是与这两种生活方式因素最相关的两个维度。此外,R3 维度显示怀孕和社交娱乐活动有显著关联;R4 维度显示出与各种饮食习惯的额外关联;而 R5 维度仅与长期疾病、情绪因素、睡眠和环境因素相关。
全基因组关联研究 (GWAS)分别确定了 16、17、13、9 和 18 个与 R1–R5 显着相关的基因位点(图5a)。其中,38 个基因位点从未与 EMBL-EBI GWAS 目录中的任何临床特征相关联,包括 11、7、6、5 和 11 个与五个 R 指数相关的基因位点。
图5. a,总体而言,使用全基因组P值阈值 (−log 10 ( P ) > 7.30),73 个基因组位点与 5 个 R 指数相关。为了便于可视化,我们用最领先的 SNP 注释了基因座。采用双侧t检验来检验 SNP 回归系数的显著性。b, EMBL -EBI GWAS 目录中我们所识别基因组位点的表型组关联(查询日期为 2023 年 7 月 2 日,通过 FUMA103 v.1.5.4)。我们检查了每个基因组位点内候选的和独立的显著 SNP,并通过综合查询将它们与各种临床性状联系起来。每个连接的宽度代表我们研究中揭示的基因组位点与文献中的临床性状之间的关联数量。这些特征被分为高级类别,包括不同的器官系统、精神和心理状况以及生活方式因素、体形等。为了增强对每个类别的直观理解,我们根据每个类别中临床特征的频率生成了关键字云图。我们排除了与大脑结构相关的特征,这些特征预计与我们识别的 SNP 具有最多的关联。
利用 GWAS 目录,我们对之前在 GWAS 中发现的遗传变异进行了表型组关联查询。具体而言,我们 GWAS 中的遗传变异之前与总共 3,895 个与多个器官系统和生活方式因素相关的临床性状相关。正如预期的那样,与所有五个 R 指数的遗传变异相关的性状主要涉及不同的大脑区域体积和通过扩散张量成像测量的白质束的微观结构特征。此外,这些基因组位点也富集了与其他器官系统相关的许多性状(图5b)。例如,R1 和 R5 基因座在与体形和心血管系统相关的性状中富集。R3 和 R5 基因座与精神病学和心理学相关的性状有关,包括精神分裂症、抑郁症和忧虑感。此外,R5基因座与 WMH 相关性状特异性相关。值得注意的是,通过基因集富集分析,我们发现 R1 维度在对皮质醇反应的生物学途径中富集(P = 1.1 × 10 −6),这与压力的介导有关。
人类大脑衰老受到遗传、生活方式和病理因素等复杂相互作用的影响,从而导致不同的神经解剖学变化。先前的研究可以分为疾病研究和人群研究。以疾病为中心的研究通常检查与特定病理相关的脑萎缩模式,例如阿尔茨海默病和神经精神疾病,重点关注严格定义的群体内的细微变化。人群研究使用一般人群分析更广泛的模式,有时没有确诊的特定病理或在疾病患病率较低的背景下。我们的研究是人口研究的演变,采用最近开发的深度表示学习方法 Surreal-GAN,在来自近 50,000 名老年人的多样化协调磁共振成像 (MRI) 数据池中寻找数据驱动的变化模式。使用这种方法,我们描绘了人类衰老过程中观察到的主要、可重复的脑萎缩模式。这些模式被认为是受各种疾病和内在因素之间相互作用的影响,并通过事后分析进一步检查,以阐明它们的遗传、临床、认知和生活方式相关性。
此外,我们通过在其潜在空间中添加相关结构扩展了 Surreal-GAN 模型,这使我们能够更好地解开同时发生和部分重叠的脑萎缩模式。改进的方法确定了五个可重复的神经解剖学变化维度,称为 R 指数:R1,皮质下萎缩;R2,MTL 萎缩;R3,顶颞萎缩;R4,弥漫性皮质萎缩;R5,周围皮质萎缩。至关重要的是,我们的方法允许评估这五个维度的个性化表达水平,从而为个性化患者管理和临床试验分层提供额外的工具。虽然我们确实观察到了 R 指数与疾病和风险因素关联的独特且重叠的模式,但我们也发现五个维度的表达之间存在相关性,表明相应的脑萎缩模式在不同程度上共同表达。总的来说,这些强调了潜在生物学或神经病理学机制的相互联系,并表明 R 指数可能在个体层面上衡量多种共同病理对大脑的影响。
维度系统阐明了病理因素与大脑衰老变化之间的复杂关系。多发性硬化症与 R3 至 R5 维度相关,但深层结构和内侧颞叶不受累,这与此前发现的该疾病弥漫性皮质变薄相一致,其原因是病理性病变破坏了结构通路和全球大脑网络44。R3和 R5也与精神分裂症和帕金森病有关,与已确定的萎缩模式相一致。具体而言,在精神分裂症中,颞中回萎缩导致 R3,与听觉-言语幻觉有关,这是该疾病的一个主要症状48。R5与各种全身性疾病表现出广泛的关联,包括神经精神疾病、心血管疾病和免疫健康因素,并且与 WMH 体积的关联性最强。这些结果可能部分归因于岛叶皮质在自主神经调节和情绪处理中的作用。最近研究越来越多地认识到岛叶在抑郁症、躁郁症和精神分裂症中的作用,特别是与内感受功能紊乱有关。另一方面,抑郁症与白质损伤有关,这可能在抑郁症病因中起因果作用。此外,不同疾病在同一维度上同时出现可以让我们了解它们共有的症状和增加的相互风险。例如,精神分裂症、帕金森病和痴呆症在相关维度上存在重叠,表现出认知能力下降和幻觉等共同症状,而精神分裂症和帕金森病与更高的痴呆风险相关。
将患有特定疾病的患者队列投影到我们的维度系统上可以深入了解疾病的异质性。各种慢性疾病,包括 MCI/痴呆、多发性硬化症和帕金森病,都表现出多个维度的表达升高。这些相关维度的个体差异可能反映了它们不同的表型和病理变化。例如,AD 是一种在老年人中普遍存在的神经退行性疾病,表现出相当大的异质性。在这五个维度中,R2、R3 和 R5 与 MCI/痴呆密切相关,并且与主要为 AD 典型特征(包括认知能力下降和异常淀粉样蛋白和 tau 沉积)显示出不同的关联。R2 与记忆障碍显示出更强的关联,而 R3 与执行功能障碍更密切相关,这些特征在 AD 患者中存在差异表达。与 R2 和R3 相比,R5 与淀粉样蛋白和 tau 的关联较弱,但与血管病理和炎症脑脊液生物标志物的关联较强,这是 AD 的另一个特征,或许可以衡量 AD 中共同病理对萎缩的组合效应。基于这些简洁的 R 指数进行聚类可能允许识别更同质的亚组,以用于临床试验招募或个性化治疗策略。
沿着疾病相关维度发生的大脑变化可能在临床前阶段表现出来,并为未来疾病转化和死亡提供预后价值。R2、R3 和 R5 表示沿着 AD 连续体临床进展的风险。R2 和R3 分别是从 CN 到 MCI 和从 MCI 到痴呆的临床转化的关键预测因子。这些结果与已知的海马和 MTL(R2)在 AD 中的早期参与以及随后病理扩散到后顶叶区域(R3)相一致。对于死亡风险,实际年龄和男性是最强的风险因素。控制它们后,基线 R 指数,尤其是 R5,保留了显着的预后价值。这些发现进一步强调了 R 指数在疾病预后中的临床适用性,以及发现针对与这些维度相关的因素的干预措施以降低风险的重要性。
我们对生活方式和环境因素的分析阐明了 R 指数的其他相关因素,从而提出了针对特定维度的潜在干预措施。吸烟和饮酒是许多疾病的两个重要风险因素,与皮质萎缩呈负相关,主要映射到 R4 和 R5 维度,对 R3 的影响较小。这些发现与之前的研究一致,这些研究表明,随着酒精消费量的增加和吸烟量的增加,整体萎缩也随之增加。此外,日常饮食习惯与 R4 和 R5 相关,具有负相关(茶和谷物)或正相关(奶酪、咖啡和盐),这与之前的观察结果一致。直接管理生活方式或研究潜在机制可能会产生可行的干预措施,尽管需要进一步研究来了解因果关系。本文确定的五种中间表型中的任何一种的表达都可以作为各自遗传和生活方式风险因素积极参与的指标,从而促使更积极的患者管理以及招募相应的临床试验。
除了日常生活因素外,某些生活经历也与大脑衰老存在跨维度关联。R1 和 R3 与怀孕相关因素的关联部分解释了它们与女性实际年龄的偏差略大的原因。值得注意的是,研究表明,分娩会对女性晚年大脑年龄产生长期影响,可能导致大脑“看起来年轻”,这被认为部分与激素或炎症机制的波动有关。我们的研究通过将这些影响映射到大脑变化的特定维度以及整体大脑年龄来增进理解。在 CN 参与者中,R2 与出生体重呈负相关,这与之前关于极低出生体重早产儿海马体积减小和学习困难的研究结果相一致。
影响大脑衰老异质性的遗传变异为干预策略(特别是在药物开发中)提供了更多见解。我们的基因分析揭示了与五个维度相关的 73 个单核苷酸多态性 (SNP),包括 GWAS 目录中没有相关性状的 38 个 SNP。先前确定的 SNP 与各种临床性状相关,验证了我们的发现。例如,R3 基因座与精神分裂症相关性状有关,而 R5 基因座与心血管和神经精神疾病以及白质高强度信号有关。此外,R1 维度与与皮质醇反应相关的基因集显示出相关性。这表明压力可能对纹状体的形态变化产生影响,纹状体是与 R1 相连的区域,已证明受压力的高度影响。这些 SNP 和相关基因的鉴定可能为药物发现或重新利用针对这些维度的干预措施提供信息。
本文得出的五个维度受到 MRI 提供的分辨率和细节的限制,即灰质和白质区域性萎缩模式、小血管缺血性疾病的测量值和脑脊液空间扩张。因此,它们不能直接测量导致这些脑萎缩的潜在神经病理学过程;然而,它们确实使我们能够通过更精确和标准化的测量直接评估特定风险因素对脑变化的个性化影响。因此,它们可以为个性化的患者管理和临床试验招募提供机会(图6)。具体而言,R 指数所代表的维度使得能够提供根据个体表达水平量身定制的更加个性化的治疗计划和生活方式建议。此外,除了促进有针对性的患者招募之外,五个 R 指数还从其他几个角度有助于优化临床试验设计。例如,跟踪特定 R 指数的变化有助于评估试验效果并提高其功效。此外,由于 R 指数和其他临床变量可以指示试验基线时的个体疾病进展速度,因此可以采用 R 指数和其他临床变量的组合来建立分层试验基准。
图6. 深度学习得出的 R 指数是大脑衰老表型的衍生指标,可作为伴随衰老的各种潜在神经病理过程的内表型或中间表型。它们还有助于了解导致这种异质性的风险和保护因素。更值得注意的是,这些 R 指数与风险因素和临床特征相结合,建立了个性化患者管理和有针对性的临床试验招募设计的具体系统。
虽然我们的研究涵盖了广泛而多样的人群进行训练和分析,但必须承认某些局限性。一个限制因素是罕见病理的代表性不足,限制了当前五种模式对所有神经病理的代表性。此外,某些疾病(如帕金森病)的样本量有限,可能会进一步影响我们将 R 指数与病理关联起来的分析能力。此外,考虑到 40 岁以下的个体数量相对有限,我们对年龄阈值的选择既受已知衰老趋势的指导,也受数据可用性的指导。我们认识到,这种方法可能会掩盖参考组中的某些临床前变化,从而可能降低我们研究的能力。
尽管存在这些局限性,增强型 Surreal-GAN 方法仍表现出广泛的适用性和巨大的模式发现潜力,它允许针对各种研究问题进行优化调整,以适应不同研究设计中数据可用性和管理的差异。此外,我们目前的五维坐标系可以作为未来大脑老化研究的基础,通过功能性 MRI 研究与大脑功能网络的关系,以及通过基因组、转录组和蛋白质组数据研究潜在的生物学机制,提供更高的特异性。此外,它为未来的扩展系统奠定了基础,该系统进一步丰富了神经解剖学异质性,这些异质性在我们目前的样本中没有充分代表的患者群体中发现,包括额颞叶痴呆、路易体痴呆和其他神经退行性疾病。我们神经影像脑图 (neuroimagingchart.com )的主要目标之一是不断扩展这个神经解剖学坐标系,以及通过云端自由轻松地进行网络访问。
总之,本研究通过提供具有五种不同大脑特征的五维表示系统来描述与衰老过程相关的神经解剖异质性。随着我们的联盟分析更多成像数据,包括扩散和功能性 MRI 以及 tau 和淀粉样蛋白正电子发射断层扫描,它将继续得到扩展和丰富。目前,该维度系统提供了一种分析结构 MRI 捕获的脑萎缩异质性的方法,并进一步了解其与人口统计学、病理学和生活方式因素以及遗传变异的关系。此外,它可能有助于个性化诊断和患者管理,以及提高临床试验的准确性和有效性。
Surreal-GAN 方法是一种弱监督深度表示学习方法,用于从神经影像数据中分离疾病异质性。其关键优势在于能够仅从基线数据中辨别空间和时间(疾病严重程度)变化,从而得出直接指示不同神经解剖变化模式严重程度的低维 R 指数。为了捕捉由于疾病影响引起的表型变化,Surreal-GAN 通过生成对抗网络 (GAN) 学习从 REF 组(例如,衰老前或健康对照)到 TAR 组(例如,衰老或患者)的多种转换。具体而言,该方法学习函数 f 将 REF 数据x转换为生成的 TAR 数据y'= f( x , z ),其中z是指示转换方向的潜在变量。与 GAN 相关方法中常见的一样,引入对抗性鉴别器 D 来区分真实 TAR 数据y和合成 TAR 数据y',从而确保生成的图像数据与真实患者数据无法区分。除此之外,还引入了逆映射 g,以根据生成的数据y'重新估计潜在变量z ,以确保潜在变量能够捕捉到独特且可识别的大脑特征。还采用了多种其他正则化,以进一步鼓励转换函数 f 近似疾病或衰老效应,同时增强变量 ( z ) 的不同维度与不同大脑区域萎缩严重程度之间的正相关关系。在训练后的模型推理阶段,利用反函数 g 推导训练过程后真实 TAR 数据的潜在变量(称为 R 指标)。通过训练过程中的 GAN 和正则化,学习到的变换函数 f 被认为是潜在病理过程的良好近似,用函数 h 表示,即 f( x , z )≈h( x ,σ( z )),其中 σ∈Ω , Ω 是一类改变潜在变量z中元素顺序的置换函数。
原始的 Surreal-GAN 模型得出了独立的 R 指数,这限制了其表征由相关潜在病理驱动的萎缩模式的能力。具体来说,在大多数基于GAN 的模型中,潜在变量或噪声变量是从训练过程之前预定义的固定分布(例如高斯分布或均匀分布)中采样的。固定的潜在分布大多不会影响模型在生成真实数据方面的性能;但是,如果我们使用反函数重新估计数据的潜在变量,它们就会有问题。如方法 1 中介绍的那样,我们假设在训练过程之后,逆一致性 g(f( x , z )) ≈ z且分布相等,。我们可以进一步得出,其中 p(g( y )) 是派生的 TAR 参与者 R 指数的分布。因此,如果我们从标准多元均匀分布中抽取z 样本(如在原始 Surreal-GAN 中一样),则派生的 R 指数的协方差将是单位矩阵,当真实 R 指数彼此相关时,这会导致偏差和模型性能下降。为了解决这个问题,我们首先使用高斯copula 为z构建了一个参数化的潜在分布,表示为,其中可学习参数θ z控制维度之间的相关性:
其中 Φ−1是标准正态分布的逆累积分布函数,是多元正态分布的联合累积分布函数,其均值为零,协方差矩阵等于相关矩阵θ z。所得分布方差等于θ z,每个维度的边际分布为均匀分布,即 U[0,1]。
更新后的损失函数使我们能够从多元均匀分布 p U ( z )=U[0,1] M中抽取z样本,但会用分布惩罚损失。在训练过程中,我们为每个批次的每个x抽取一个z值,而不是对所有可能的z值取期望值。因此,为了平等地惩罚这两个项,对等式 ( 6 ) 的第一项也应用了相同的修改,其中最初不包括z 。
此外,为了防止收敛到极端分布(例如,两个潜在变量变得完全相关),我们添加了一个正则化项来控制和 p U ( z ) 之间的距离。因此,最终修改后的 GAN 损失函数等于:
本研究中使用的 MRI(方法 9)和临床(方法 10 和 11)数据由基于成像的衰老和神经退行性疾病坐标系统 (iSTAGING) 研究整合和协调。iSTAGING 研究包括通过各种成像协议、扫描仪、数据模式和病理学获取的数据,包括来自三大洲 13 多个研究的 50,000 多名参与者,涵盖广泛的年龄范围(22 至 90 岁)。具体而言,本研究使用了来自 ADNI 、UKBB 、巴尔的摩老龄化纵向研究(BLSA)、澳大利亚老龄化影像、生物标志物和生活方式研究(AIBL)、约翰霍普金斯大学正常个体认知能力下降生物标志物研究(BIOCARD)、开放获取影像学研究系列(OASIS)、宾夕法尼亚大学记忆中心队列(PENN)、威斯康星州阿尔茨海默病预防登记处(WRAP)研究、年轻人冠状动脉风险发展研究(CARDIA)、波美拉尼亚健康研究(SHIP)84和妇女健康倡议记忆研究(WHIMS)的52,319 名参与者的数据。其中,6,576 名参与者的纵向数据可用。表1详细列出了每项研究的人口统计数据和样本量。本研究分析的老龄参与者主要是白种人(n = 44,539),占报告种族信息的总参与者的 95.1%。除 SHIP 之外,所有研究都提供了种族信息。参与者对相应研究提供了书面知情同意书。本研究的方案得到了宾夕法尼亚大学机构审查委员会的批准。ADNI 数据库于 2003 年启动,由首席研究员 MW Weiner 领导,旨在整合各种评估,包括 MRI、正电子发射断层扫描和临床评估,以监测 MCI 和早期 AD 的进展。更新信息请访问https://adni.loni.usc.edu/。
表1. 模型训练和数据分析的参与者和研究
为了训练 Surreal-GAN 模型,我们纳入了 1,150 名 50 岁以下参与者的基线数据作为 REF 组,以及 8,992 名 50岁以上参与者的基线数据作为 TAR 组,其中包括患有 MCI 或痴呆症的参与者。我们注意到 REF 和 TAR 组之间的规模不平衡;但是,在此过程中,我们分别优先考虑每个组的大小和覆盖范围,以便所选样本更好地代表数据分布。我们的目标是在每个组中纳入尽可能多的数据,同时在各个研究中保持更均匀的分布,以防止任何单个研究占主导地位。因此,REF 和 TAR 组最多包括来自每个研究的 300 和 1,000 名个体。TAR组的样本量较大,也可以更好地覆盖由于异质性而方差较大的老龄化人口的分布。首先对 REF 和 TAR 组中的所有个体进行残差处理,以排除使用线性回归在 REF 组中估计的性别和颅内容积 (ICV) 效应。然后,根据 REF 组对调整后的特征进行标准化。在没有基本事实的情况下,我们按照原始 Surreal-GAN 论文 10 中介绍的选择程序,通过测量重复训练模型之间的一致性(方法 6)来选择最佳维数M 和两个重要的超参数 γ和λ。在无监督学习(例如,表示学习或聚类)中,可重复性对于确定派生表示和后续分析的可靠性至关重要。对于每一种超参数组合,我们重复训练模型 50 次,并确定了在 50 个模型中导致最高一致性的最佳超参数(M = 5、γ = 0.1、λ = 0.8)。在 50 个相应的模型中,使用与其他模型具有最高平均成对一致性的模型来推导出全部49,482 名老年参与者的五个 R 指数。
我们将五个稳健超参数α = 0.02、κ = 80、ζ = 80、μ = 500 和η = 6 设置为默认值,这些值对模型性能的影响最小10。为了选择最佳训练周期,模型经历了 1,500,000 × 个周期,当重建损失和单调性损失分别低于 3 × 10 −3和 6 × 10 −4时,每 45,000 个周期保存一次检查点。与其他超参数一样,重复训练模型之间的一致性再次指导了最佳周期的确定。至于优化过程,使用了 ADAM 优化器,其中鉴别器的学习率 (lr) 为 1.6 × 10 −4 ,变换函数f和反函数g的学习率 (lr )为 8 × 10 −4,潜在分布 lr ) 为 2.7 × 10 −5。β 1和β 2分别设置为 0.5 和 0.999。此外,对于所有实验,批次大小均设置为 300。考虑到其特殊性质,我们使用相关矩阵的下三角因子对潜在分布 (高斯 copula) 进行参数化。其他模型结构和训练算法与原始 Surreal-GAN 10相同。
对于超参数选择和结果可重复性评估,我们构建了一个指标,旨在量化两组 R 指数r 1和r 2之间的一致性水平。为了评估它们的一致性,我们计算了两个不同的相关性,如下所示:
1.维度相关性定义为所有维度的M 个Pearson 相关的平均值:
2.差分相关定义为 所有维度对 :
为了推导这两个值,我们尝试对第二组指标进行不同的排列,以确定最佳比对。由此得出的相关性称为“R 指标相关性”,代表这两个测量值的平均值,并作为 r 1和 r 2之间一致性的定量指标。
我们首先在男性和女性群体中独立评估了五个维度的可复制性。具体来说,我们将原始训练样本分为 4,176 名男性(528 名 REF和 3,648 名 TAR)和 5,966 名女性(622 名 REF和 5,344 名 TAR)参与者。随后,使用同一组超参数对每个群体分别重新训练Surreal-GAN,以得出特定于性别的维度。
为了进一步测试已确定的五个维度的可重复性,我们使用完全独立的训练集重新训练了模型并进行了比较。具体来说,我们重新抽样了 1,000 名衰老前参与者和 4,818 名未包括在原始训练集中的衰老参与者。每项研究最多将 500 名个体纳入 REF 组(衰老前组),而最多将 2,000 名个体分配到 TAR 组(衰老组)。方法 4 中介绍的相同程序用于为复制训练集和所有老年参与者推导 R 指数。
我们进行了几个半合成实验,以评估改进的Surreal-GAN 模型在各种场景中的鲁棒性,并验证我们的超参数选择策略(方法 4)。
对于半合成数据构建,我们遵循了 Surreal-GAN 论文中的半合成数据集构建方法,将 1,779 名 CN(年龄 < 70 岁)个体分为 REF 组(579 名个体)和 Pseudo-TAR 组(1,200 名个体)。对于 Pseudo-TAR 组中的每个参与者(表示为第i名参与者),从多元均匀分布中采样一个三维模式严重程度向量,代表基本事实。我们根据采样的严重程度向量向 1,200 名 Pseudo-TAR 个体引入了三种萎缩模式,每种模式涉及不同的区域。与 Surreal-GAN 论文不同的是,我们还模拟了三个维度之间不同程度的相关性。(1)对于奇异相关性,仅在两个维度之间分别模拟了 0.2、0.4 和 0.6 的相关性。(2)对于综合相关性;在这三个维度上模拟的相关性分别为 0.2、0.4 和 0.6。
首先,目标人群的萎缩率一直是影响 Yang 等人提出的原始 Surreal-GAN 模型可靠性的重要因素。我们重新评估了改进后的Surreal-GAN 在不同脑变化率下的表现。我们构建了半合成数据集,其中包含相同的三种模拟模式,但模拟脑变化范围不同:0-30%、0-20% 和 0-15%。我们不仅评估了每个模型在最初训练的数据集上的表现,还评估了其在萎缩程度不同的另外两个数据集上的有效性。计算了得出的 R 指数与基本事实 s 之间的 R 指数相关性,以量化它们各自的性能。此外,为了更好地了解大脑衰老背景下的萎缩率,我们使用从参考组估计的平均值和标准差来计算所有数据集(包括三个半合成数据集和来自老龄化人群的真实数据)中感兴趣区域 (ROI) 的z分数。
其次,为了评估改进的 Surreal-GAN 捕捉潜在病理之间关联的能力,我们使用模拟脑部变化为 0–20% 的半合成数据集比较了两个模型。改进的 Surreal-GAN 模型和原始的 Surreal-GAN 模型在每个具有不同相关性水平的半合成数据集上重复训练了 50 次。
最后,我们使用半合成数据集测试了方法 4 中提到的超参数选择策略的有效性,其中模拟的萎缩率最高为 15%。由于问题的难度,不同超参数之间的表示准确度差异较大,因此该数据集特别适合评估我们的超参数选择策略。
采用全自动流程处理 T1 加权 MRI。首先对所有 MRI 进行强度不均匀性校正。86采用多图谱颅骨剥离算法去除颅外物质。随后,使用多图谱标签融合方法在灰质(119 个 ROI)和白质(20 个 ROI)中识别出 139 个解剖 ROI。这些多图谱分割方法依赖于多个解剖参考图像,这些图谱使用可变形配准单独扭曲到目标图像,因此对单个变形的错误具有很强的鲁棒性。
由于样本量很大,我们对上述处理实施了一个两步半自动化质量控制流程,分别应用于来自不同研究的不同数据批次。首先,自动排名系统评估每个批次内分割的 ROI 体积的分布,将值转换为z分数并计算累积排名分数。这识别并排名偏离预期范围最大的图像。使用 MRISnapshot(一种内部质量控制工具,可通过https://github.com/CBICA/MRISnapshot访问)手动审查预定义数量的排名图像。MRISnapshot 的用户友好型 Web 界面允许通过以可配置的方式直接在特定图像切片上显示所选标签的叠加层,从而高效导航和标记大型数据集。
我们进一步合并了来自左半球和右半球的对称 ROI,得到了 72 个 ROI 体积,用作Surreal-GAN 模型的特征。通过使用配准方法90将颅骨剥离图像与单个受试者大脑模板空间对齐,计算出灰质和白质组织 (称为 RAVENS)的体素区域体积图。WMH 体积是通过基于深度学习的分割方法计算的,该方法建立在 U-Net 架构之上,使用不均匀性校正和联合配准的 FLAIR 和 T1 加权图像。使用在 CN 人群中经过广泛验证的统计协调方法估计部位特定的均值和方差,并在控制协变量的同时应用于整个人群。
在 UKBB 研究中,我们基于 Tian 等人分析的变量,选择了我们 UKBB 数据集合中存在的所有 120 个变量。这些变量表明个体在早期生活经历(例如出生体重和活产年龄)、生活方式(例如吸烟和饮酒)、社交娱乐(例如拜访朋友或家人的频率和看电视的时间)、心理状况(例如情绪状态)、当地环境暴露(例如沿海距离和空气污染)和总体健康状况方面的差异。如 Tian 等人所述,对几个变量进行了重新编码,以便于解释。
我们纳入了 ADNI 提供的脑脊液和血浆生物标志物,以及九项研究提供的认知测试分数。对于 ADNI,所有测量数据均从LONI 网站 (http://adni.loni.ucla.edu ) 下载。Hansson等人描述了脑脊液中 β -淀粉样蛋白 (Aβ) 和磷酸化 tau (p-tau)的详细测量方法。其他脑脊液和血浆生物标志物则使用多路复用xMAP Luminex 平台测量,详情请参阅“生物标志物联盟ADNI 血浆靶向蛋白质组学项目 - 数据入门”(可在http://adni.loni.ucla.edu获得)。ADNI研究之前已验证了多个领域的几个综合认知分数,包括 ADNI-MEM 、ADNI-EF 、视觉空间功能综合 (ADNI-VS) 和语言综合 (ADNI-LAN) 。 ADNI-MEM 基于雷伊听觉言语学习测试、阿尔茨海默病评估量表 - 认知子量表 (ADAS-Cog) 和简易精神状态检查 (MMSE) 的组成部分。ADNI-EF 使用韦氏成人智力量表修订版中的动物和植物类别流畅性、连线 A 和 B、数字广度倒退、数字符号替换以及时钟绘制任务中的圆圈、符号、数字、指针和时间项目。ADNI-LAN 使用动物和植物类别流畅性、波士顿命名总分、MMSE 语言元素、ADAS-Cog 中的遵循命令/对象命名/概念练习以及蒙特利尔认知评估语言元素,包括字母流畅性、命名和重复任务。ADNI-VS 基于具有五个不同评分元素的时钟复制、MMSE 的复制互锁五边形元素和 ADAS-Cog 的构造实践项目构建。除了这些涵盖各种测试的综合分数外,我们还纳入了大多数(至少 8 个)研究中广泛使用的另外四个认知分数。不同研究使用不同的标准收集教育程度变量。
根据 UKBB 研究的自我报告(字段 ID 20002)和医疗记录(字段 ID 41270 和 41271),我们将患者组定义为 14 种不同的慢性疾病,包括 MCI/痴呆、中风、多发性硬化症、高血压病、糖尿病、抑郁症、躁郁症、精神分裂症、帕金森病、COPD、骨关节炎、CKD、骨质疏松症和缺血性心脏病。此外,MCI/痴呆症类别还包括来自其他六项研究的 2,550 名参与者,包括 ADNI、AIBL、BIOCARD、BLSA、OASIS 和 PENN。精神分裂症类别包括另外 71 名来自 PHENOM(通过维度神经成像评估精神病异质性)的参与者。被诊断患有一种以上疾病类别的个体被分配到多个组。此外,2,971 名未患 14 种疾病的UKBB 参与者被归类为 HC 组。2021 年 3 月 4 日发布的 UKBB 死亡率数据(字段 ID 40000)用于分析死亡风险。死亡日期是通过与英国国家死亡登记处的数据链接确定的(文档位于https://biobank.ndph.ox.ac.uk/showcase/showcase/docs/DeathLinkage.pdf)。总体而言,397 名参与者在基线获取脑部 MRI 后被确认死亡。
我们首先计算了 R 指数与实际年龄以及所有 R 指数之间的皮尔逊相关性。偏相关已用于衡量两个变量之间的关联,同时控制一组协变量的影响。鉴于年龄和性别可能与 R 指数和其他分析变量都表现出显著相关性,我们利用偏相关,将年龄和性别校正为协变量,以检查不同年龄和性别组中 R 指数解释的所有其他基线变量的其他变化。在将 HC 与 R 指数中的每种疾病组进行比较时,我们首先通过多元线性回归年龄和性别效应,然后计算两组之间的 Cohen'sd效应大小。从数学上讲,偏相关等同于将控制的协变量作为右侧变量的多元回归,因此它们具有相同的P值,而偏相关是β系数的标准化版本。对于来自多项研究的变量,分类研究信息也被纳入作为附加协变量。由于样本量较小,使用 Benjamini–Hochberg 程序将 CSF/血浆生物标志物的错误发现率控制在 5%,使用 Bonferroni 校正。
为了评估每个 R 指数与未来从 CN 到 MCI 或从 MCI 到痴呆症的进展之间的关联,我们纳入了 5,807 名有纵向诊断的参与者,其中 4,777 人在基线时被诊断为 CN,1,030 人在基线时被诊断为MCI。我们采用 Cox 比例风险模型,同时调整年龄和性别等协变量来测试关联。协变量被作为模型右侧的附加变量,因此风险函数具有以下形式:计算HR,exp(β R ),并将其报告为表示每个变量影响的效应量度量。 R 指数对疾病进展风险的影响。此外,为了定量评估以 R 指数为特征的预后性能,我们逐步将最具预测性的 R 指数添加到 Cox 模型中,以了解其最佳性能。在 100 次重复的 20% 保留交叉验证中,使用一致性指数 (C 指数) 量化风险预测的性能。使用相同的流程,我们还使用来自 UKBB 的所有 38,675 名参与者评估了每个 R 指数与死亡风险之间的关联,其中 397 人在基线评估后确认死亡。
我们使用估算的基因型数据进行所有遗传分析。我们的质量检查流程产生了 32,829 名具有欧洲血统的参与者和 8,469,833 个 SNP。总之,我们根据以下排除标准排除了个体或遗传变异:(1)通过家庭关系确定的相关个体(最高可达二度);(2)重复变异;(3)自我认定的性别与基因认定的性别不符的个体;(4)缺失基因型超过 3% 的个体;(5)次要等位基因频率低于 1% 的变异;(6)缺失基因分型率大于3% 的变异;(7)未通过 1 × 10 −10的 Hardy–Weinberg 检验的变异。为了调整人群分层,我们使用 FlashPCA软件100得出了前 40 个遗传主成分。
对于 GWAS,我们使用 Plink 对每个 R 指数进行线性回归分析,控制年龄、性别、年龄-性别相互作用、年龄平方、年龄平方-性别相互作用、总 ICV 和前 40 个遗传主成分等混杂因素。我们采用全基因组P值阈值(5 × 10 −8),并考虑连锁不平衡注释独立的遗传信号。
我们查询了 EMBL-EBI GWAS 目录中每个基因座内的显著独立 SNP(查询日期为 2023 年 6 月 2 日,通过 FUMA 102 v.1.5.4),以确定它们之前确定的与任何其他特征的关联。我们进一步将这些特征分为 11 个类别,以便进行可视化和解释。
我们使用 MsigDB 数据库 (v.6.2) 中的基因集进行了基因集富集分析。对所有测试基因 ( P < 2.64 ×10−6 ) 和基因集( P < 4.68 ×10−6 ) 进行了Bonferroni 校正。FUMA 中的所有其他参数均按默认设置。
参考文献:Brain aging patterns in a large and diverse cohort of 49,482 individuals.
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有