
本研究评估了基于电导的典型微回路模型下静息态磁脑图(MEG)动态因果建模(DCM)的可靠性,评估指标包括后验参数估计和模型证据。我们使用了来自患有阿尔茨海默病的队列的两次测量数据,这两次测量间隔2周,该病例具有高度的个体间差异。我们关注的不是疾病的效应,而是方法的可靠性(即个体间会话间的一致性),这对于未来疾病进展和药物干预的研究至关重要。为了评估一级DCM的可靠性,我们比较了有无类间相关性的情况下,与个体特异性自由能(即模型的“质量”)相关的模型证据。接着,我们使用参数经验贝叶斯(PEB)方法研究了在个体间水平上推断出的DCM参数概率分布之间的差异。具体来说,我们检验了以下几种参数差异的证据:(i)个体内、会话内、时段间;(ii)个体间会话间;以及(iii)站点间个体间,同时考虑了参数估计之间的条件依赖性。我们发现,在时间接近且环境相似的情况下获取的数据中,超过95%的推断DCM参数不太可能存在差异,这表明会话之间具有相互可预测性。使用PEB,我们展示了传统定义的“可靠性”与推断模型参数之间的条件依赖性之间的相互关系。我们的分析确认了基于电导的DCM在静息态神经生理数据中的可靠性和可重复性。在这方面,隐式生成模型适用于神经和精神障碍的干预和纵向研究。
1. 简介
动态因果建模(DCM)已广泛应用于转化神经科学中,用以阐明包括电/磁脑图(MEG)在内的生理观测数据背后的潜在原因。然而,使用影像和分析方法揭示疾病进展和治疗干预的效果依赖于其可靠性。本文讨论了DCM的可靠性,使用变分贝叶斯反演的生物学信息模型对神经影像数据进行分析,这些模型可以用来描述认知的神经机制以及疾病或药物的影响。我们测试了静息态MEG数据的DCM推断是否可靠,即是否能预测同一会话中不同试验的结果,以及同一参与者不同会话的结果。
DCM通过使用变分贝叶斯反演生物学驱动的动态系统模型来处理神经影像数据,以提供给定模型未知参数(例如,突触生理学)的后验估计,以及模型证据。为了比较不同的假设,这些假设通过不同的模型表示,人们使用自由能界限上的[对数]模型证据差异,类似于对数贝叶斯因子。贝叶斯模型简化(BMR)可用于嵌套或替代先验下的模型证据(及后验参数估计)的事后计算。去除冗余参数可以通过减少模型复杂性来提高模型证据。BMR不仅计算效率高,还能在模型反演过程中避免局部最小值。在群组水平上,一种称为参数经验贝叶斯(PEB)的层级贝叶斯反演方法容纳多个一级(单一受试者)模型,并根据量化受试者间效应的经验先验来约束生理参数。PEB利用BMR快速高效地计算每个受试者在群体约束下的后验估计。每个受试者的经验先验的隐式修订使得局部最小值不太可能发生,因为这些先验受到群体均值的影响。这种效应在改善的(自由能界限上的)模型证据方面在受试者间水平上有定量反映。
在本文中,我们评估了DCM中这些方法的可靠性,特别是在不同试验之间以及跨会话的可靠性测量方面。在本文中,我们评估了DCM中这些方法的可靠性,特别是在不同试验之间以及跨会话的可靠性测量方面。
在本文中,我们采用频率主义方法来评估动态因果模型(DCM)参数的可靠性。频率主义方法仅考虑参数的期望值,即最大似然估计,而不考虑后验方差或协方差。在理想情况下,频率主义对DCM可靠性的估计可能足够。然而,在复杂模型中——参数间存在高后验协方差时——特定参数的期望值的可靠性可能非常低。DCM参数的可靠性还通过对诱发电位的分割抽样以及静息态磁脑图(MEG)进行了检验。然而,频率主义的可靠性评估方法不适用于具有模型参数间后验协方差的复杂非线性动态系统。
因此,我们通过参数经验贝叶斯(PEB)量化了可靠性,有效地比较了有无受试者或会话效应的受试者或会话模型。这可以被解释为评估参数概率分布间的可靠性,即在没有受试者或会话效应的情况下,一个受试者或会话的后验估计与另一个的估计相似。
本文的三个目标是:(i) 使用变分贝叶斯方法测试从MEG数据反演得到的DCM中证据估计(即自由能)的可靠性;(ii) 利用参数经验贝叶斯(PEB)测试可靠性,特别是关于有效连接性的推断(即参数的后验概率分布);以及(iii) 测试DCM中后验参数的协方差对参数估计可靠性的影响。可靠性指的是一致地复现给定结果的能力(并且用于查询数据的工具或仪器以一致、可复制的方式进行)。我们基于PEB(用于“群体DCM”)的提议方法考虑了关于突触生理学的“推断”的可靠性,包括会话内和会话间的可靠性。这排除了使用经典的可靠性度量(例如,相关性或内部类相关系数[ICC]),因为这些经典统计量只能用于单一测量(即没有不确定性的情况),而不适用于使用DCM进行的推断(关于突触生理学)所基于的概率分布。可靠性在评估可复制性、普适性和预测有效性方面扮演着关键角色,无论是在参数估计还是基于模型的推断上下文中。
在本研究中,我们使用了参与“阿尔茨海默病新疗法”研究的受试者所收集的静息态磁脑图(MEG)数据的重复测量。我们的重点不是模拟疾病效应,而是评估突触效能的估计值的可靠性。我们简要描述了在基线和2周后休息时收集的参与者和数据。这些数据是在无任务或静息状态下获得的,适用于进行慢性病患者的纵向研究。在阿尔茨海默病的背景下,我们考虑了默认模式网络(包括双侧角回、内侧前额叶皮层[MPFC]和前内侧区)的振荡动态。尽管内侧颞皮层与阿尔茨海默病有先验关联,但MEG对该区域的活动相对不敏感。默认模式网络的连接性在阿尔茨海默病及其治疗中已被广泛研究。我们进行了一级DCM,从MEG的交叉谱密度(CSD)中估计默认模式区域的突触参数。然后,我们使用广义线性模型方法考虑模型证据估计的可靠性,并使用PEB评估DCM参数的可靠性。最后,我们讨论了前述分析的潜在应用和局限性。
2. 材料和方法
2.1 被试
本研究已获得剑桥2号研究伦理委员会的伦理审批。参与者提供了书面的知情同意书。参与者符合阿尔茨海默病症状性诊断标准,包括轻度认知障碍,并有阳性淀粉样蛋白生物标志物。主要参与者(共十四人)在两次会话中进行了两次静息状态下的MEG扫描,两次会话间隔2周,扫描在类似的日间时间进行,并且在期间没有进行任何药物更改。他们的平均年龄为74.8岁(标准差±7.33),迷你精神状态检查(MMSE)得分为26.1/30(标准差±3.05),剑桥认知检查(修订版,ACE-R)得分为78.5/100(标准差±10.5)。第二组参与者进行了基线MEG扫描,年龄(73岁,标准差±5.33)和认知能力与主要参与者相近。
2.1.1 静息态MEG数据
在静息状态下(眼睛保持睁开),使用Elekta Vector View系统(配备204个平面梯度计和102个磁力计)收集了5分钟的MEG数据。MEG数据以1000 Hz的采样率连续记录。使用双极眼电图和心电图电极记录参与者的水平和垂直眼动。在EEG帽上放置了五个头部位置指示器线圈以追踪头部位置。使用Polhemus数字化设备,对三个基准点(鼻根、左侧和右侧耳前)以及超过100个头部形状点进行了数字化。
使用Elekta Neuromag工具箱(Elekta Oy),配合MaxFilter v2.2.12软件进行坏传感器的检测和插值、信号空间分离以去除数据中的外部噪音以及头部运动校正。然后,我们通过将数据下采样至500 Hz、进行0.1至100 Hz的带通滤波,并应用48–52 Hz和98–102 Hz的陷波滤波器来预处理数据。接下来,我们使用ICA进行了伴随EOG数据的伪迹检测/去除。我们将数据切分为1000毫秒的时间段,并重复每个时间段的伪迹检测和去除。
使用T1加权结构MRI(3T Siemens,TR = 2300 ms,TE = 2.91 ms,分辨率1 mm),我们执行了DICOM到NII的转换,并对规范网格进行了逆规范化,大小为2。我们使用三个基准点和头部形状点将MRI与网格进行共注册,以创建单壳层边界元模型方法的MEG前向模型。我们使用“COH”源反演方法提取了左右角回(LAG [49 -63 33],RAG [-46 -66 30])、内侧前额叶皮层(MPFC [-1 54 27])和楔前叶(PPC [0 -55 32])中的四个默认模式网络源/区域。我们在1000毫秒的时间段内,频率范围0.1–100 Hz,使用磁力计和梯度计的数据融合选项进行了诱发源反演。我们提取了试验中功率谱密度的主成分,作为DCM的CSD的数据特征。
我们使用三组静息状态下眼睛睁开的MEG数据进行可靠性研究:(i)分割样本基线数据,其中每个患者的数据被划分为奇数和偶数时间段;(ii)基线与2周后数据的对比;(iii)基线数据与第二组参与者的基线数据。
2.2 静息态MEG的DCM
我们使用SPM12版本8163的DCM(动态因果建模)针对CSD(谱密度)来推断基于电导的生物物理规范微回路模型(cmm-nmda模型)的参数和边缘似然,这些参数和似然是从MEG数据的频谱特征中获得的。DCM针对CSD通过局部线性扰动(由内源性神经波动引起)来解释MEG数据的频率内容,这种扰动围绕着规范神经回路模型的非线性固定点进行。
该基于电导的模型描述了基于四种神经元群体互动的皮层源的电活动:兴奋性棘突星状细胞、表层锥体细胞、抑制性神经元以及深层锥体细胞(图1)。每个皮层源通过前向连接(起源于表层锥体细胞群,投射到其他区域的兴奋性棘突星状细胞和深层锥体细胞)和后向连接(起源于深层锥体细胞,投射到目标源的表层锥体细胞和抑制性细胞群)与其他区域相连。每个群体都使用Morris–Lecar模型(由随机内源性波动驱动)进行建模。

图1 MEG中的中尺度模型
2.3 参数经验贝叶斯
在会话间或受试者间的动态因果建模(DCM)中,通过在第二层上使用经验先验(例如年龄、疾病严重程度等)对第一层(例如突触)参数进行分层变分贝叶斯反演。在第一层,神经模型被优化以拟合每个个体的数据。在第二层,一些参数的估计受到群体估计的约束,以提高群体模型的证据。这些参数是那些配备了随机效应的参数。对于这些参数,存在微观和宏观先验,分别在第一层和第二层约束相应的后验估计。
微观先验来源于生理学文献,而宏观先验则基于从数据来源的人群中获取的信息(即经验先验,如年龄或疾病严重程度)对参数施加约束。由于利用了贝叶斯模型平均(BMR),评估宏观尺度约束对突触参数的影响不需要重新估计第一层的DCM。
2.4 DCM的可靠性
2.4.1 没有不确定性的固定量的可靠性
本节评估了固定效应(即,不含不确定性或随机效应的测量)之间的可靠性,例如模型的自由能。我们用列向量k1和 k2表示两组类似现象的测量,每个向量的维度为nx1(例如,参与者的数量),并指定以下线性模型:k1=k2β+ε。
在上式中,β表示两次测量之间模型的截距。测量之间的可靠性可以通过噪声项的协方差分量来指定,该噪声项ε服从均值为 0、协方差为σ的正态分布,具有复合对称性。
参数ρ是类间相关系数。协方差矩阵的复合对称结构假设矩阵的所有非对角线元素相等。这意味着任何两个变量或测量之间的协方差在所有对之间都是相同的。这是统计分析中的常见假设,特别是在重复测量或被试内设计的背景下。这种协方差形式适用于测量测量之间的可靠性,并且可以通过几种方式进行动机激励。首先,复合对称性应用了同质性假设,所有变量对之间的协方差相等,意味着各变量或测量之间的关系在整体上是相似的。这简化了建模过程,并减少了需要估计的(协方差)参数数量。其次,由于在同一受试者上重复测量产生的观察结果具有可互换性。即,任何一对测量无论何时进行,彼此之间的关系都是相等的。复合对称性假设通过设置所有非对角线元素相等来反映这种可互换性。第三,复合对称形式简化了协方差矩阵,有助于模型的估计和解释。由于需要估计的参数较少,分析变得更加高效:这在处理有限数据时尤其相关。在我们的可靠性分析背景下,复合对称性意味着在不同条件或时间点下,测量的可靠性保持一致。
为了测试可靠性,可以在方程 7 中反转通用线性模型,并在协方差矩阵中包含和不包含 ρ,使用贝叶斯模型比较来比较各自的自由能,以评估类间相关的证据。我们使用在 SPM12 中实现的变分拉普拉斯来估计协方差分量,包含和不包含类间相关。
2.4.2 推断的DCM参数的可靠性
群体DCM的反演(又称PEB)从每个数据的反演开始,然后评估经验先验的效果并调整参数,以便自由能最大化。在更新的二级参数下,贝叶斯模型缩减(BMR)用于重新评估一级后验。这大大加快了群体数据的反演速度。通常的做法是询问两个队列之间是否有任何差异。这个问题可以通过所谓的“PEB的PEB”来解决。这种分析涉及反演针对单独队列的二级模型,然后在第三级(PEB)分析中结合,以识别共享特征和差异。"PEB的PEB"分析的目标是阐明代表不同队列的模型之间的相似性和差异,提供对研究中的人群之间潜在差异的洞察。受到可靠性的经典定义的启发,即不存在会话间或受试者间效应,我们评估了带有和不带有这些效应的PEB模型的证据。这构成了预测效度的等价物,这在推断参数(即,多变量概率分布)的背景下是有用的。我们对每个参数分别进行PEB估计;其中突触速率常数T、内在突触增益H、外在连接A和AN、状态到观测参数L和J以及生理输入a和d受到其群体平均值的约束(一个单列的全一矩阵)。我们采用了PEB的PEB方法,使用一个矩阵,其第一列包含全一(常数项),第二列包含零和一,分别指示每个组。该方法用于评估会话间或受试者间效应的证据。
3. 结果
附录材料中展示了每个源和受试者的磁脑图(MEG)数据的功率谱。此外,在图2中,我们展示了一个动态因果模型(DCM)拟合的样本,以预测响应与观测响应的对比形式呈现。
基线与两周后的功率谱比较显示它们并不相同。这些差异不可归因于如此短时间内疾病的进展,而可能源于其他因素,包括心理状态(例如,疲劳)、记录噪声或运动等。

图2 这些图形显示了在睁眼状态下,基线(BL)和2周后(TW)四个默认模式网络源的观测到的功率谱密度(PSD)及其相关的DCM预测响应。基线与2周后数据之间的差异不可归因于疾病的进展,而可能与可塑性、心理效应、不同的疲劳、测量噪声或运动等因素有关。针对四节点默认模型网络DCM的预测DCM响应表明,神经模型复制了区域的PSD数据。关于其他受试者在基线和2周后数据的预测和观测响应的类似图形,在补充图表1S至7S中给出。
3.1 DCM可靠性
我们基于测试和重测数据检验了模型自由能估算的可靠性:数据来源于一次会话的分割样本,或同一参与者的两次会话,或两个类似的参与者组,如图3所总结。自由能估算在会话内的分割样本数据和会话间的同一受试者数据中表现出高度可靠性。对于同一受试者的模型,具有复合对称性的模型(即,具有高的类间相关性)的自由能更高,差异为20(相当于贝叶斯因子约为5×10^8)。另一方面,即使在人口统计和临床匹配的情况下,不同人群数据模型的自由能之间没有显示出类间相关性的证据。这是预期之中的:尽管生成MEG数据的生物物理模型中的大多数神经参数对于匹配的成年人是相似的,但信噪比和其他非神经因素的差异可能对模型证据的自由能估算(也称为边缘似然)产生深远影响。

图3 默认模式网络中一级多通道DCM自由能的可靠性
为了测试会话间和受试者间的效应,我们使用了PEB的PEB来评估156个生理参数的可靠性;包括突触速率常数(T)、内在突触增益(H)、外向和内向的AMPA连接(用A表示)和外向和内向的NMDA连接(用AN表示)、状态到观察参数(L和J),以及生理输入(a和d)。在会话内分割样本分析中,PEB的PEB显示,在奇数和偶数试验之间,只有4个参数出现差异(见图4a)。在受试者间会话分析中,PEB的PEB显示,156个参数中只有4个在不同会话之间存在差异(见图4b)。最后,在两个类似的参与者组之间,有9个参数显示出受试者间效应的证据(见图4c),表明这些组间存在相当一致的协议。

图4 使用PEB的PEB方法评估完全连接的默认模式网络DCM的156个推断参数的可靠性,针对以下三种情况:(a) 同一受试者内、同一会话内的拆分样本数据;(b) 同一受试者、不同会话间隔2周的数据;(c) 同一地点内不同受试者之间的数据。
3.2 可靠性和参数相关性
为了量化后验参数估计的可靠性与其相关性之间的关系,我们检查了在第一级DCM后参数的预期值以及通过PEB重新估计的值,即实施经验先验或约束的第二级DCM。在表4中,我们报告了内在的、外向和内向突触参数,在第一级DCM估计和通过PEB在经验(第二级)约束下重新估计之间,相关性大于0.5的参数数量。这证实了在实施经验先验后,它们的可靠性得到了提高。PEB重新估计第一级DCM参数以通过减少模型复杂性和隐含解决条件依赖性来提高模型证据。实际上,推断的参数变得更加条件独立,因此在传统意义上更加可靠。
4. 讨论
我们评估了使用会话内、会话间和受试者间获取的MEG数据进行的DCM的可靠性。在所有三种情况下,从静息态MEG功率谱获得的群体级基于电导的DCM估计在推断的神经参数分布方面具有很高的可靠性。为了比较固定量(例如,模型证据的自由能估计),我们使用变分拉普拉斯方法估计由于类内相关性引起的协方差成分。为了评估具有随机效应的参数之间的一致性,我们使用了“PEB的PEB”来测试会话间和受试者间的效应,发现在分割样本和重复测试分析中具有出色的泛化性。这表明DCM对于电生理观察具有高度的可靠性。此外,我们确认了参数估计之间的可靠性和条件依赖性(协方差)之间的相互关系。换句话说,当参数之间的协方差减少时,它们期望的可靠性增加。
频率学派的单一参数相关性,通常通过“传统”的ICC方法测量,不适合于复杂模型(如DCM,具有高后验协方差)的上下文。这主要是由于参数之间的条件依赖性。然而,如自由能等替代指标在会话间保持一致,尽管推断参数之间存在条件依赖。这种一致性表明模型比较是可靠的,从而为指定和测试与会话差异相关的不同假设提供了有用的手段(例如,药物干预或疾病进展)。此外,我们关注可靠性的底层含义,并采用“PEB的PEB”方法来确定会话间效应。在DCM中使用特定于受试者的生物标记作为先验,例如在翻译建模和精准医学中,这一点尤其重要。参数之间的后验协方差是可靠性差的主要原因(这一点以前已被观察到,但在这里被明确调查)。通过改善模型的自由能(即模型的证据),可以观察到参数可靠性的某些改善(可以将其理解为通过减少模型复杂性来改善模型证据,从而减少参数之间的后验相关性)。通过改进和提供更好的先验(例如,通过MRS或PET数据),模型的自由能得到改善。然而,重要的是要注意,即使在多模态DCM或富含病理学的DCM的情况下,传统的可靠性公式仍然不适用于推断的参数,因为这些参数是概率分布,而传统的可靠性测试是为重复的单一测量定义的,没有考虑不确定性。
这种分析的主要动机是解决从复杂生物物理模型中推断的可靠性问题,其中神经发生器是非线性的,参数估计是相关的。在以前的研究中,尽管模型证据和用于假设检验的模型比较的可靠性很高,单个DCM连接参数被证明是不可靠的,除非是非常简单的模型。可靠性差归因于它们的协方差,建议使用基于模型证据的模型比较进行假设检验。
参数推断对数据的变化敏感(可能出现在重复测量或受试者间数据中)。神经疾病的翻译神经建模提出了一个重大挑战,需要一个可靠的假设检验平台。DCM提供了这样一个平台,但其实用性取决于重复测量和会话间的一致性。通过利用静息态数据,我们反转了具有适度复杂性的默认模式网络的神经模型。我们展示了可以从任何数据集中得出一致的结论,因为这些数据的自由能在数据集之间保持一致。这补充了早期关于诱发反应、频谱功率和功能连接性可靠性的报告。确实,使用诱发反应而不是静息态可能进一步增加可靠性,尽管静息态数据便于进行大规模临床研究。我们展示的可靠性足以作为实验医学的建模平台,改善我们对神经疾病的理解和治疗。然而,使用PEB,可以有效地识别分割样本和重复测试数据之间潜在神经动力学的相似性,约95%的参数与数据来自相同分布一致,而在我们的研究中没有疾病进展的迹象。
参数估计在非线性模型下伴随着一定程度的共线性,即改变一个参数等同于改变其他参数。换句话说,生成模型中不同的参数组合可能产生非常相似的数据。这组参数可以被视为一个流形,这在生物学上是合理的,但在基于特定参数值测试假设时具有挑战性。历史上,解决这个问题的方法包括减少模型复杂性,通过重新参数化和为功能性MRI的生成模型定义先验。然而,这种重新参数化并不简单,对于M/EEG的生成模型可能无法实现,因为这些模型的M/EEG皮层生成器固有的复杂性。为了解决这个问题,我们利用BMR和PEB找到了具有较低复杂性的嵌套模型,以更好地捕捉潜在动态。
PEB的使用可以看作是BMR在队列研究中的扩展。PEB非常适合评估是否可以通过用DCM中的经验先验替换非信息性(或弱信息性)先验参数来改善队列数据的模型证据;即,经验约束。在PEB中,通过利用群体信息重新估计一级DCM,所有参数都受到群体信息的指导。如果两组数据如会话内预期的那样来自同一分布,则PEB的PEB不应识别生成模型参数的差异。应用PEB后可靠性的提高部分是由于在群体DCM反演期间应用BMR,这有助于减少复杂性,并隐含地减少参数之间的后验相关性。
DCM中参数和模型证据的概率分布的可靠性只是它们验证的一个方面。考虑到获取时间接近且条件“相似”的数据,不期望推断的参数是相同的。尽管在2周内疾病进展不太可能达到有意义的程度,但其他差异,如疲劳、焦虑、运动或扫描仪噪声,可能会出现。这些差异很可能会在纵向或干预的“重复测量”研究中出现。减少这些混杂因素对翻译神经科学的影响是一个程度问题,减少这种影响的方法包括(i)使用更大的数据样本和(ii)在个体差异上包含信息性先验。预计DCM对实验医学研究具有前景,特别是在估计受试者间差异(如药物干预或疾病进展)以及通过模型比较指导治疗决策方面。例如,之前研究探索了在帕金森病和精神障碍中深脑刺激或药物干预的效果,已经证明了这种潜在应用。然而,一些以前的DCM应用依赖于参数的期望值,使用后验期望值作为重复测量ANOVA的因变量。这种方法忽略了对参数估计的后验不确定性,这对于理解数据的潜在生成器可能是至关重要的。一个实际的策略——解决这个限制——是通过BMR,它允许评估替代先验,如治疗或时间效应,如何预测并阐明对个别患者干预的影响。例如,Friston, Preller等人(2019年)的近期单一受试者研究使用了这种方法来阐明神经血管耦合的机制。
总结来说,我们展示了基于后验概率和会话内、会话间可靠的相对模型证据的可靠推断。群体反演提高了一级DCM的自由能并提高了个别参数的可靠性。这些DCM,包括MEG的典型微回路模型,提供了一个足够可靠的建模平台,可用于纵向或干预研究。
参考文献:Reliability of dynamic causal modelling of resting-state magnetoencephalography.
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。