摘要:青少年的大脑发育结构彰显出显著的个体差异。然而,受限于大规模纵向神经影像数据的稀缺性,当前研究往往聚焦于人群平均特征,而对于驱动这些个体差异的神经生物学根源,我们的了解仍然相对有限。为了深入探讨这一问题,我们依托IMAGEN青少年队列,进行了长达9年(横跨14至23岁)的跟踪研究,成功识别出三组具有独特全脑灰质体积(GMV)发育轨迹的青少年群体。与其余两组相比,第一组青少年在青春期阶段展现出了GMV的持续减少趋势,且伴随着较高的神经认知表现。而第二组青少年则呈现出GMV下降速度较慢的特点,其神经认知性能相对较低,这一现象可能受到了表观遗传差异及更为沉重的环境压力的共同影响。至于第三组青少年,由于遗传变异的作用,他们表现出GMV的增加趋势,但基线的神经认知表现却相对较低。进一步地,通过利用英国生物银行的数据资源,我们初步观察到这些基于GMV的差异在个体进入成年中后期时可能趋于减弱。本研究不仅揭示了基于GMV的青少年神经发育模式的多样性,还为我们探索这些模式对个体长期发展可能产生的潜在影响提供了宝贵的线索。
1. 引言
青春期,作为大脑重构与成熟的关键且活跃的阶段,经历着突触形态重塑、树突分支复杂化、皮质细胞放电模式调整以及神经化学受体亲和力变动等一系列区域性的深刻变化。这一时期,不仅是个体身心发展的关键窗口,也是多种神经精神疾病风险显著上升的敏感期,如品行障碍、情绪障碍乃至精神分裂症等。因此,青春期的结构性神经发育对于强化认知能力、奠定成年期心理健康基石具有不可估量的重要性。基于大规模人群的研究已揭示,青少年在结构神经发育层面展现出显著的个体差异,即异质性特征。然而,尽管这一现象已被广泛认识到,但其背后的神经生物学机制仍笼罩在迷雾之中,亟待深入探索。当前,大多数研究聚焦于大脑功能回路与结构组成的解析,以及这些特征与人群层面精神健康障碍之间的关联。这些开创性的工作通过纳入庞大的样本量,极大地丰富了我们对青少年大脑发育过程的理解。然而,值得注意的是,行为模式与大脑发育轨迹之间的关联在个体层面展现出高度的多样性。这意味着,在公共卫生政策的制定与精准医疗实践的推进中,深入理解这些差异的来源及其背后的机制变得尤为关键。唯有如此,我们才能更加精准地预测青少年的神经发展轨迹,为他们提供更加个性化、有效的健康干预措施。
大规模纵向神经影像研究,通过追踪基于神经影像衍生表型的发育轨迹,成功地对青少年进行了聚类分析,从而生动描绘了每个个体大脑形态的动态演变过程。类似的方法已在非典型大脑结构与神经精神疾病神经解剖学变异之间建立了强有力的联系。神经影像生物标志物作为研究工具,极大地拓宽了我们对神经退行性疾病和精神疾病神经病理机制的理解视野,然而,其在神经发育领域的应用尚待充分挖掘。结构磁共振成像(sMRI)作为一种无创手段,为成像衍生表型的测量提供了可能,其中灰质体积(GMV)的发育过程已被证实与青春期髓鞘形成和突触可塑性紧密相关。这些发现共同预示了依据全脑GMV结构生长轨迹来识别不同动态大脑结构集群的潜力。
本研究旨在深入探讨青少年大脑发育的个体异质性,揭示可能驱动这种异质性的遗传、表观遗传及环境因素,并进一步分析这些异质性大脑发育模式对未来生物及社会福祉的长期影响。为实现这一目标,我们采用了数据驱动的方法,利用IMAGEN队列中覆盖整个青春期至成年早期的纵向神经影像数据,将青少年划分为具有不同全脑GMV发育模式的群组(图1a)。同时,结合全基因组和表观基因组关联研究(EWAS),我们致力于剖析与每个群组相关联的遗传和表观遗传变异。
需要指出的是,本研究存在一定局限性,即由于样本量有限,并为避免种族混杂效应,我们的研究仅限于自我报告为白人的参与者。为拓宽研究视野,我们将IMAGEN队列与青少年大脑认知发展研究(ABCD)和英国生物银行(UKB)进行了跨数据集的联系,通过不同的映射方法假设人口同质性,从而将研究范围从青春期扩展至儿童晚期及成年中晚期。具体而言,我们将IMAGEN中的纵向大脑变化映射至基线神经影像表型,并评估了这些横截面大脑测量值与ABCD中人口聚类之间的关联,假设每个结构性大脑测量值从童年晚期至青春期的线性变化具有可比性。此外,ABCD中的基因组和神经影像数据助力我们识别了与特定人群集群相关的潜在遗传变异。最后,利用UKB中的基因组、神经影像学及其他相关表型数据,我们进一步探讨了遗传变异对神经发育长期影响的潜在机制。
图1 全脑灰质体积 (GMV) 发育模式定义了三个神经发育组
2. 结果
2.1 青春期全脑 GMV 的发展轨迹
我们首先估算了44个大脑感兴趣区域(ROI),包括34个皮质和10个皮质下ROI的GMV纵向轨迹,这些轨迹跨越了从基线(14岁)到两次后续扫描(分别为19岁和23岁)的青少年整个大脑发育过程,同时调整了颅内容积(ICV)、性别、利手习惯和扫描部位等潜在影响因素。结果显示,个体在基线总GMV及GMV发展轨迹上展现出显著的异质性和潜在的聚类模式。
为了进一步探索这些具有神经生物学意义的聚类,我们采用主成分分析(PCA)对ROI子集中的发育模式进行降维处理,并选取了前15个主成分(PC),这些PC共同解释了全脑GMV轨迹总变异的80%。特别地,第一和第二个PC分别占据了方差的41%和6%,定义了两种全脑GMV轨迹的组合模式,这些模式与基线总GMV显著相关。值得注意的是,这些PC与剑桥赌博任务中的不同项目表现出各异的关联模式,其中PC1与延迟厌恶和风险调整显著相关,而PC2则与深思熟虑时间、总体投注比例和风险承担显著相关。随后,我们利用这些PC进行多变量聚类分析,以识别出具有不同神经发育模式的青少年群体。
在至少完成两次sMRI扫描的1543名青少年中,我们的分析成功地将他们划分为三个结构性神经发育群组。第一群组包含711名青少年,他们展现出较高的基线总GMV,并在随访期间持续下降,这与一般人群GMV的发展趋势相吻合。第二群组由765名青少年组成,与第一群组相比,他们的基线总GMV和峰值GMV均较低,且GMV下降速度较慢。此外,第二群组青少年在年龄、性别比例、父母受教育程度及14岁时WISCIV满分等方面也表现出显著差异。第三群组则较为特殊,仅包含67名青少年,他们不仅基线总GMV最低,而且GMV在随访期间意外地增加,这与一般人群的发展趋势截然相反(图1b)。与第一群组相比,第三群组青少年的父母受教育程度较低,且14岁时WISCIV满分也显著较低。
为了深入了解这些群组异质性的神经生物学基础,我们进一步分析了他们之间全脑GMV发育的差异。结果显示,第三群组在颞下、颞中、眶额外侧、中央前和额上等多个区域的GMV发育普遍延迟(图1d)。而第二群组则在上额叶、尾中额叶、喙中额叶、中央前和顶下等区域的ROI中表现出较低的峰值GMV和较慢的GMV下降率(图1d)。这些区域均为大脑中最后成熟的区域,且在执行功能中扮演关键角色。这一发现促使我们思考,结构性神经发育的变化是否能够预测这些群组的神经认知发展轨迹及神经精神疾病的风险。
图2 结构神经发育可预测神经认知和神经精神疾病的危险因素
2.2 结构神经发育预测神经认知和神经精神疾病的危险因素
为了深入探讨神经发育与执行功能之间的内在联系,我们对比了这三个群组在基线和最后一次随访时的神经认知表现差异。研究揭示,与神经发育正常的第1组相比,神经发育显著延迟的第3组在基线时即展现出较差的神经认知功能,包括空间工作记忆、剑桥赌博任务(CGT)和停止信号任务(SST)的表现。然而,令人鼓舞的是,随着时间的推移和大脑的持续成熟,第3组在多数神经认知项目上的表现均有所改善,并在最后一次随访时达到了与第1组统计学上无显著差异的水平(图2a)。这一积极变化与第3组GMV在特定脑区(如顶部区分ROI)的增长呈正相关,进一步预示了结构发育与神经认知改善之间的紧密联系。
相反,尽管第2组在GMV下降速度上较为缓慢,但其在神经认知方面的表现却并未能同步改善,反而在最后一次随访时相对于基线出现了恶化,特别是在CGT和SST任务上(图2a)。这一现象或许可以通过GMV与神经认知发展轨迹之间的负相关性来解释,特别是在顶部区分ROI区域。
第3组青少年大脑及神经认知的迟缓发育引发了我们对他们神经精神疾病风险的关注。尽管我们观察到与神经认知改善相一致的注意力缺陷/多动障碍(ADHD)症状减少趋势,但抑郁症状却有所增加(图2b)。同样,第2组青少年在神经认知表现恶化的同时,也伴随着抑郁症状的加剧(图2b),这进一步凸显了该群体在生物、社会和心理层面的多重劣势。
鉴于男性和女性在GMV发展模式上的差异,我们进一步实施了性别分层分析。结果显示,尽管存在细微差别,但群体聚类的总体趋势与原始分析高度一致。性别分层分析还揭示了神经认知和心理健康症状在不同性别间的特异性表现,如男性的冒险和冲动行为更为突出,而女性则在空间工作记忆上展现出显著差异。此外,第2组中抑郁症状的增加仅见于男性,而第3组中则仅限于女性,这进一步强调了性别在神经发育和心理健康中的重要作用。
为了探究遗传变异对神经发育和神经认知表现的影响,我们计算了每个青少年在主要神经发育障碍及相关特征(如ADHD、自闭症谱系障碍(ASD)、教育程度(EA)和智力(IQ))上的多基因评分(PGS)。结果显示,第3组在ADHD的PGS上显著高于第1组和第2组,而第2组与第1组之间则无显著差异。这一发现提示,第3组中神经发育和神经认知的延迟可能与较高的ADHD遗传倾向密切相关。然而,我们并未在ASD、EA和IQ的PGS上观察到三组间的显著差异。这些结果为我们理解遗传变异在神经发育延迟中的作用提供了新的视角。
图3 全基因组关联研究 (GWAS) 确定了第 3 组中与神经发育迟缓相关的一个重要位点
2.3 遗传和表观遗传变异有助于结构神经发育
为了更深入地解析结构性神经发育背后的遗传根基,我们针对ABCD研究中的7662名青少年,特别针对第3组与第1/2组之间的差异,开展了一项全基因组关联研究(GWAS)。鉴于IMAGEN研究的样本量限制,直接进行GWAS动力不足,我们巧妙地采用了组重加权GMV(灰质体积)作为替代表型。由于ABCD研究中年龄范围的局限性,无法直接估算GMV的发育模式,因此,我们构建了群体重加权GMV,以此作为探索遗传关联的桥梁。
这一连续的表型设计,实质上反映了个体相对于第1/2组而言,更倾向于归入第3组(即表现出大脑发育延迟)的程度。我们的策略是,首先利用IMAGEN研究中基线神经影像数据,并经过潜在混杂因素的校正后,计算出能够区分第3组与第1/2组的ROI(感兴趣区域)特定权重。随后,将这些权重应用于ABCD研究的基线数据中相应ROI,从而得到第3组重加权GMV。这一创新性的代理表型在随后的第3组GWAS中发挥了关键作用。
值得注意的是,第3组重加权GMV与ABCD中的神经认知表现呈现出显著的负相关关系,这一发现强有力地证明了第3组重加权GMV作为神经发育延迟有效代理指标的合理性(图3a)。为了研究的全面性,我们也计算了第2组重加权GMV,并同样将其作为第2组GWAS中的代理表型,以期进一步揭示不同群组间神经发育的遗传差异。
图4 全表观基因组关联研究 (EWAS) 发现了与第 2 组神经发育降低相关的显着信号
在第3组的全基因组关联研究(GWAS)中,我们成功识别了一个具有全基因组显著效应的遗传位点(图3b)。该位点为6号染色体上的单核苷酸多态性(SNP)rs9375442,其β值为0.51,P值达到9.25×10−9,位于CENPW基因的内含子区域。CENPW是一种关键蛋白编码基因,参与端粒末端包装和细胞周期的有丝分裂过程。研究指出,祖细胞中CENPW表达的上调可能通过干扰神经发生或促进细胞凋亡,进而减少皮质体积和认知功能。
进一步分析显示,CENPW的其他变异与皮质表面积、脑体积、一般认知能力以及身体生长均有关联。基于这些基因关联分析,我们确认了CENPW在神经发育中的重要作用(补充图11)。随后,在IMAGEN研究中,我们对第3组GWAS的结果进行了验证。通过构建CENPW特异性多基因评分和整体基因组多基因评分(PGS),我们发现第3组的CENPW显著高于第1/2组(图3c),并且CENPWscore与神经认知和行为问题的改善之间存在正相关关系(图3d),PGS也呈现出类似的结果。
相比之下,第2组GWAS并未发现全基因组显著的SNP。然而,第1/2组在神经发育模式及相关特征(如ADHD、ASD、IQ和EA)上的遗传倾向表现出高度一致性,这提示第1组和第2组之间神经认知表现的差异可能是定量的,而非定性的,且可能受到环境因素的显著影响。社会经济和家庭因素的基线差异也支持了这一点,如社会经济/住房压力源评分、健康状况、关系/成瘾问题以及家族肯定程度等在第2组与第1组之间存在显著差异。
为了探究环境因素对神经发育的具体影响,我们在IMAGEN中进行了表观遗传组关联研究(EWAS),以组别为表型。研究发现,cg06064461位点存在显著的高甲基化现象(图4a),该位点位于2号染色体上的ATF2基因和MIR933微小RNA之间。ATF2编码的转录因子在大脑中广泛表达,与神经变性和神经发生密切相关。MIR933与ATF2共享启动子,并通过调控脑源性神经营养因子提供神经保护作用。
进一步验证EWAS结果时,我们发现cg06064461的甲基化与总GMV轨迹呈正相关,而与峰值GMV呈负相关(图4b, 4c)。然而,在多重测试校正后,cg06064461甲基化并未显示出对环境-神经发育途径的中介作用(图4d)。值得注意的是,较高水平的家族肯定与通过减少cg06064461甲基化而获得的较高峰值GMV相关,尽管这一关联在未经校正时达到显著性,但在校正后未保持显著性(图4e)。这些结果提示,环境暴露可能通过诱导神经发生相关基因的表观遗传变化来影响神经发育,尽管这种影响在样本量有限的情况下可能较为微妙。最后,我们在EWAS中比较了第3组与第1/2组,但未发现任何重要差异位点,这可能反映了不同组别间神经发育障碍机制的复杂性和异质性。
图5 基因预测的神经发育对成年中后期的社会经济、认知和心理健康结果影响有限
2.4 遗传变异对成年中后期的认知、心理健康和社会经济结果影响有限
众所周知,遗传脆弱性与结构性神经发育的异常在个体成年后的身体、社会及心理健康中扮演着至关重要的角色,其长远影响深远且复杂。然而,关于遗传变异如何长期塑造这些神经生物学机制并产生具体效应,我们仍知之甚少。为填补这一知识空白,本研究聚焦于英国生物银行(UKB)的数据,旨在探究神经发育迟缓的多基因风险如何以及在何种程度上与长期的大脑结构变化、认知能力、社会经济成就及心理健康状况相关联。
社会经济状况的评估涵盖了家庭总收入、体力劳动参与度以及教育、就业与收入方面的多重剥夺指数;认知能力则通过流体智力测试及最高教育程度来衡量;而心理健康状况则综合了焦虑与抑郁的诊断、神经质评分、自我报告的情绪稳定性及负性情绪体验等指标。
受第3组GWAS结果的启发,我们首先为UKB中的每位参与者计算了神经发育迟缓的多基因风险评分(PGS)及CENPW基因特异性评分,随后将这些评分与一系列关键结果变量进行了关联分析。结果显示,PGS与CENPWscore均呈现近似正态分布,且与总灰质体积(GMV)显著负相关(图5a),这表明了遗传风险与大脑结构变化之间的紧密联系。
进一步细化分析显示,PGS与CENPWscore在多个脑区的GMV中均表现出显著的区域特异性关联。具体而言,头侧中额叶、梭状回、外侧眶额叶、内侧眶额叶及头侧前扣带回等区域与神经发育迟缓PGS的相关性尤为突出;而外侧眶额叶、尾部中额叶、岛叶及上额叶等区域则与CENPWscore高度相关(图5b)。这些发现与神经发育迟缓风险较高者表现出较差的空间工作记忆能力相吻合,进一步支持了遗传风险对认知功能的潜在影响。
PGS与较低GMV之间的负相关可能反映了神经发育延迟的持续效应、遗传介导的环境暴露影响或遗传相关的神经退行性过程。然而,这些潜在的生物学机制尚需深入研究加以阐明。最后,我们通过非优越性检验验证了相关系数的显著性,确认神经发育迟缓的PGS与CENPW评分与所有感兴趣结果之间的关联均具有统计学意义,进一步巩固了我们的研究结论(图5c)。
3. 讨论
青春期,这一生命旅程中的动态成熟阶段,显著标志在于大脑与认知能力的未完全成熟,导致决策过程可能不够理想,进而增加了行为问题发生的风险。近年来,科学界日益认识到青少年大脑发育的显著异质性,这意味着基于人口平均水平的研究可能难以准确揭示大脑动态变化与神经精神疾病风险之间的复杂联系。
鉴于此,我们创新性地采用了一种数据驱动的方法,成功识别出三类具有独特全脑神经发育模式的青少年群体。这些群体不仅展现出特定的遗传或表观遗传变异特征,还预示着与神经认知发展轨迹及成年中后期社会经济成就和心理健康状况的潜在关联。
神经影像学及动物实验证据显示,青春期是大脑高阶区域灰质经历突触修剪与髓鞘形成而逐渐变薄的关键时期。因此,此阶段灰质异常增加,尤其是负责执行功能的关键区域,可能反映了大脑成熟的延迟。而灰质变薄速度的减缓,则可能暗示突触与髓鞘形成的密度不足,进一步限制了神经认知功能的优化与信息处理效率的提升。这些不同的成长轨迹能够深刻影响青少年的行为与学习能力,其影响甚至可能贯穿一生。
值得注意的是,人类大脑的发育是遗传与环境因素交织作用的复杂过程。通过整合三大人群队列的基因组学、神经影像学、行为及健康数据,我们进一步证实了遗传变异在大脑成熟与神经认知发展延迟中的作用,同时也揭示了不利环境暴露及其引发的表观遗传变异对大脑发育与行为缺陷的长期负面影响。特别地,我们观察到第2组与第1组之间的差异更多体现在量的累积上,这可能与不利环境暴露的累积程度密切相关,表现为两者神经发育模式的高度重叠及与不利环境因素相关的小效应量。
EWAS与中介分析的结果共同揭示了环境暴露与青少年大脑发育之间潜在的因果关联及其背后的表观遗传与神经生物学机制。然而,这并不意味着第3组与第1组间的差异完全归因于遗传,或第2组与第1组间的差异仅由环境所致。未来的研究需依托更大样本量与更强的统计能力,以深入探索基因与环境在大脑结构发育中的复杂交互作用。
总体而言,本研究在个体层面深入探讨了纵向大脑发育轨迹及其与成年后期神经认知与社会经济成果的内在联系。尽管我们已尽力将不同队列的数据进行关联分析,但受限于各队列的设计目的与数据成分差异,这种跨队列映射仍可能受到混杂偏差的影响。未来研究需进一步验证桥接方法的稳健性,并开展长期随访以确认社会经济结果的可靠性。同时,考虑到IMAGEN研究仅涉及健康个体,我们的发现对于特定疾病人群的适用性尚需进一步验证。此外,鉴于青少年中可能存在的亚临床症状,神经影像学研究在揭示这些症状与大脑发育的神经生物学联系方面将发挥重要作用。
最后,本研究提出的三个青少年群体构成了理解异质大脑发育问题的重要起点,但全面认识这一动态过程还需结合多种神经影像模式与多模式表型进行深入探索。
4. 方法
4.1 伦理声明
在本研究中,所有涉及的队列数据均严格遵循了相关的伦理法规与标准,确保了研究的合法性与道德性。具体而言,ABCD(青少年脑认知发展研究)与人类连接组计划(HCP)均获得了美国国立卫生研究院(NIH)的鼎力支持,这一支持不仅体现在资金上,更在于对研究伦理的严格监督与指导。
费城神经发育队列(PNC)则是由宾夕法尼亚大学与费城儿童医院联合发起,并获得了双方机构的高度认可与正式批准,这确保了研究在数据收集、处理及分析的每一个环节都符合伦理规范。此外,IMAGEN研究作为一项跨国合作项目,其各个研究地点,包括伦敦国王学院、诺丁汉大学、都柏林三一学院、海德堡大学、德累斯顿工业大学、原子能和替代能源委员会以及大学医学中心等,均得到了当地伦理审查委员会的批准与监督。这一跨国合作不仅展现了科学研究的国际合作精神,也强调了在不同文化背景下对研究伦理的共同尊重与遵循。至于英国生物银行(UKB),作为本研究的重要数据来源之一,其运作与研究活动均受到了西北多中心研究伦理委员会的严格监管与批准。作为一个大型的生物样本库与数据库,UKB在保护参与者隐私与数据安全方面采取了多项措施,以确保研究的伦理性与合法性。
在所有这些研究中,我们始终秉持着尊重参与者权益的原则,对所有参与者及其家长/监护人(针对18岁以下参与者)进行了详尽的知情同意过程。我们明确告知了他们研究的目的、方法、可能的风险与益处以及他们的权利与义务等信息,并在他们充分理解并自愿同意的前提下,才进行了相关的数据采集与研究工作。这一过程不仅体现了我们对参与者权益的尊重与保护,也是科学研究得以顺利进行的重要基石。
4.2 参与者
在本研究中,我们依托IMAGEN研究这一丰富资源,集成了基因组学、神经影像学、环境暴露、行为学及心理健康等多维度的数据,旨在深入探索青少年神经发育模式的奥秘。为了确保分析结果的准确性与可靠性,我们设定了严格的数据清洗标准,将任何在感兴趣区域(ROI)内灰质体积(GMV)超出四个四分位数范围(IQR)的个体视为异常值,并予以剔除。经过这一排除过程,我们最终纳入了1543名在14至23岁年龄段内至少接受了两次结构MRI扫描的青少年(其中男性占比48.4%)进行分析(详见补充表16)。这些参与者的平均MRI扫描次数为2.63次,具体扫描时间点分布为:974名青少年完成了三次扫描(分别在14岁、19岁和23岁),另有569名青少年完成了两次扫描(其中384人在14岁和19岁接受扫描,147人在14岁和23岁,剩余38人在19岁和23岁接受扫描)。此外,我们还从ABCD研究中获取了基线年龄在9至11岁之间的11,760名参与者的数据(其中男性占比52.2%),每位青少年平均接受了1.68次结构MRI扫描。为了更全面地理解大脑结构发育的长期趋势,我们还纳入了英国生物银行中502,409名年龄在37岁至73岁之间的参与者数据,其中男性占比45.6%。补充表17详细总结了这三个大型人群队列的参与者人口统计学特征与基线数据。值得一提的是,除了上述主要数据来源外,我们还从人类连接组计划发展数据集(HCP-D)中选取了652名5-22岁的参与者(男性占比46.2%),以及从HCP青年人数据集(HCP-YA)和费城神经发育队列(PNC)中分别纳入了1113名和1587名8-23岁的参与者(HCP-YA中男性占比45.6%,PNC中男性占比47.6%),这些数据仅用于神经影像学分析。关于本研究中使用的所有人群队列的完整描述、数据收集流程、分析方法及详细统计信息,请参阅补充方法部分。我们致力于确保研究过程的透明度与可重复性,以便同行学者能够在此基础上进行进一步的探索与验证。
4.3 结构MRI数据的分析
数据预处理:在本研究中,我们首先对从ABCD、IMAGEN、HCP-D、HCP-YA以及PNC等研究中获取的T1加权神经影像数据进行了严格的质量控制处理。这一过程确保了数据的质量与可靠性,为后续分析奠定了坚实基础。具体而言,我们利用FreeSurfer v6.0软件的横截面处理管道,对经过初步筛选的数据进行了深入的形态结构评估。在此过程中,我们采用了Desikan-Killiany (h.aparc) 图集来定义并提取皮质区域的特征,同时利用ASEG图集对皮质下区域进行了精确划分与量化。这些图集的选择基于其在神经科学领域的广泛应用与认可,能够为我们提供详尽且准确的脑区形态学信息。为确保提取结果的准确性与可靠性,我们依据FreeSurfer软件内置的重建质量控制(QC)措施,对每一步处理结果进行了细致的质量检查。这一步骤不仅包括对图像质量的直观评估,还涉及对重建过程中可能出现的误差与异常进行识别与修正。关于数据收集与预处理的详细流程与方法,我们已在补充方法中进行了全面而深入的描述。这些描述不仅涵盖了数据的来源、筛选标准与处理方法,还详细记录了每一步操作的具体步骤与参数设置,以确保研究的可重复性与透明度。
GMV发展轨迹的估计:使用线性混合效应回归模型估计每个青少年 44 个 ROI 中每个的 GMV 轨迹。为每个青少年提取随机斜率的经验贝叶斯估计。颅内容积(ICV)、性别、惯用手和成像部位被用作协变量来调整潜在的混杂因素。
主成分分析 (PCA) 和组聚类:我们采用了主成分分析(PCA),具体通过stats 4.2.2包中的prcomp函数,对基于44个ROI的神经影像数据所估计的标准化个体灰质体积(GMV)轨迹进行了高效的降维处理。在此过程中,我们首先计算了居中后的GMV轨迹的奇异值分解(SVD),随后从SVD的右奇异向量中提取了旋转矩阵,这一步骤对于构建主成分(PC)空间至关重要。
组间GMV轨迹比较:通过t检验对三组中每个ROI的GMV发展轨迹进行两两比较。选择具有最大绝对 t 值的前5个ROI作为相应组之间最有区别的 ROI。
群体间年龄和区域特异性 GMV发展的估计:为了全面描绘从儿童晚期至成年早期这一较长生命阶段内区域特异性灰质体积(GMV)的动态发展过程,我们整合了来自多个大型人群队列的外部神经影像数据资源。这些队列涵盖了广泛的年龄范围与丰富的样本量,总计纳入了21826名参与者,其中包括ABCD研究中9至14岁年龄段的11811名参与者,HCP-D中5至22岁的652名参与者,以及PNC研究中8至23岁的1587名参与者。鉴于传统三次模型在捕捉超过23年GMV轨迹时的局限性,以及二次模型在处理9年之前数据时的不足,我们创新性地采用了一种综合方法。具体而言,我们利用从横截面研究(HCP-D与PNC结合)中获得的参考曲线,作为估计特定区域在5年内(直至25岁)GMV发展轨迹的基准。这种方法有效克服了单一模型在时间跨度上的限制,确保了估计结果的连续性与准确性。进一步地,我们将IMAGEN研究中的GMV数据与参考人群中相应ROI的GMV数据之间的距离作为因变量,纳入了一个包含随机截距与斜率的二次线性混合效应模型中进行分析。此模型还充分考虑了颅内容积(ICV)与成像位点等潜在混杂因素的影响,通过相应的调整提高了分析的精度与可靠性。最终,我们通过对每组随机效应的经验贝叶斯估计进行汇总,并将其与总体平均估计相结合,成功绘制出了针对特定人群组的GMV发育曲线。这一成果不仅为我们提供了关于青少年至成年早期脑结构变化的深入见解,也为后续研究探索神经发育的个体差异与潜在机制奠定了坚实基础。
IMAGEN 中总 GMV 的群体特异性发育曲线的估计:采用了两阶段估计程序。利用似然比检验在一系列多项式混合效应模型中选择最优模型。首先,使用上述群体神经影像数据估计了5-23 年的群体 ICV 发育曲线。在个体和研究水平上拟合具有随机截距的二次线性混合效应模型。为了估计参考人群 (ABCD+HCP+PNC) 中总 GMV 的发展曲线,选择了针对 ICV 进行调整的立方模型,并在个体和研究水平上进行了随机截距。为了估计 ABCD 和 IMAGEN 群体中总 GMV 的发育曲线,选择了在个体水平上随机截距和斜率调整 ICV 的立方模型。提取随机效应的经验贝叶斯估计并在每组中进行平均。第一阶段估计的群体 ICV 用于拟合特定组的曲线。特定群体总 GMV 的第 5 个和第 95 个百分位被计算为每个年龄的 95% 置信区间。
环境负担、神经认知、行为和精神障碍的比较:为了全面探究不同群体间在环境负担、神经认知功能、行为风险因素及精神症状等方面是否存在显著差异,我们在IMAGEN项目中深入分析了参与者在14岁、16岁、19岁及23岁四个关键年龄点的纵向数据。在评估个体特质时,我们采用了NEO五因素量表(NEO-FFI)与气质和性格量表(TCI-R),以精准捕捉参与者的个性、气质与性格特征。关于环境负担的评估,我们广泛收集了包括产前暴露(如父母吸烟、母亲饮酒及孕期医疗问题)、出生体重、压力性生活事件、儿童期创伤经历、家庭生活环境及压力源等多维度信息,这些信息通过怀孕和出生问卷(PBQ)、生活事件问卷(LEQ)、儿童创伤问卷(CTQ)、发展幸福感评估访谈(DAWBA)的家庭压力量表及家庭生活问卷等工具系统收集。在神经认知表现方面,我们利用了剑桥神经心理学测试自动电池(CANTAB)、货币选择问卷(KIRBY)以及停止信号任务(SST)等标准化测试,以全面评估参与者的认知功能与决策能力。同时,通过优势和困难问卷(SDQ)、欧洲学校酒精和毒品调查项目(ESPAD)及法格斯特罗姆尼古丁依赖测试(FTND)等工具,我们对参与者的行为问题及物质使用情况进行了详尽的行为评估。心理健康状况方面,我们借助自评版发展幸福感评估访谈(DAWBA)评估了多动症与抑郁症等精神症状,其中多动症评分还结合了家长评价访谈的结果,以提供更全面的评估视角。为确保分析结果的准确性,我们采用了针对性别、惯用手及颅内容积(ICV)进行调整的广义线性模型,对基线与最后一次随访时的特定测试(如模式识别记忆、情感Go-No Go (AGN) 及快速视觉信息处理 (RVP) 在19岁与23岁时的表现)进行了比较,同时,对于所有其他测试,我们也遵循了相同的调整原则。特别地,在儿童多动症与抑郁症评分的分析中,我们还将基线评分作为协变量纳入模型,以控制潜在的基线效应。值得注意的是,超维度内定移(IED)测试仅在23岁时进行,而家长评定的ADHD评分则限于14岁与16岁。在回归分析后,我们计算了每次测量的Cohen d值以量化效应大小,并采用了错误发现率(FDR)校正方法,以控制量表内部多次测试带来的假阳性风险,确保结果的稳健性与可靠性。补充方法中详细描述了这些评估工具的具体使用与数据分析流程。
GWA 和验证:鉴于ABCD研究中每位参与者的结构MRI扫描次数有限且年龄跨度受限,直接估计个体灰质体积(GMV)的发育轨迹面临挑战。因此,我们创新性地采用了组重加权GMV作为替代表型来克服这一局限。这一方法基于几个核心假设:一是假定所有大脑区域在童年至青春期的GMV变化遵循类似的线性模式;二是ABCD与IMAGEN研究的参与者群体具有同质性;三是为保持一致性,ABCD分析中仅纳入了自我报告为白人祖先的个体。为了有效区分不同组别,我们首先从IMAGEN数据中通过调整年龄、性别、惯用手和成像位置等因素,对44个ROI的基线GMV进行了回归分析,从而确定了各ROI对组分类的特异性贡献。随后,我们采用Logistic回归模型作为分类工具,并聚焦于贡献最大的前10个ROI,以计算ABCD中的组重加权GMV。鉴于第3组与第1组及第2组的比较结果高度相似(如补充图19、20所示),为提升统计效能,我们将第1组与第2组合并,进而开展了全基因组关联研究(GWAS),聚焦于第3组与合并后的第1/2组(即大脑发育延迟组)之间的差异。GWAS分析在白人群体中通过Plink 2进行,同时控制了性别、扫描仪效应以及前20个主成分分析(PCA)成分,以确保结果的准确性。为验证组重加权表型的有效性,我们将第3组的重加权GMV与一系列神经认知评估结果相关联,这些评估包括骰子游戏任务(GDT)、延迟贴现任务(DDT)以及ABCD中的NIH工具箱测试,后者涵盖了图片词汇测试(PVT)、侧卫抑制控制(Flanker)、工作记忆(List)、分类能力(DCCS)、处理速度(Pattern)、记忆功能(PSMT)、阅读能力(Reading)等多个维度,并提供了流体认知(FluidCog)与结晶认知(CrystalCog)的综合评分。所有测量的详细信息均可见于补充方法部分。基于基因的关联分析则通过MAGMA进行,使用了与GWAS相同的协变量调整策略。为进一步验证GWAS结果,我们计算了CENPW基因区域内特定SNP的遗传风险评分(PGS,即CENPW评分)及全基因组范围内的PGS。具体而言,我们在CENPW上下游各250kb范围内筛选了四个SNP,并利用PRSice工具,结合组重加权基线GMV预测性最强的P阈值(如补充图22所示),计算了这些SNP的PGS。最后,我们分析了第3组与第1/2组之间的PGS分布,以及PGS在14岁和23岁时与神经认知功能、行为特征及精神障碍之间的相关性,同时采用错误发现率(FDR)对量表内的多次测试进行了校正。
参考文献:Investigating grey matter volumetric trajectories through the lifespan at the individual level.
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。