多种伪迹去除工具和流程已被开发用于校正静息态脑电波并挖掘其背后的科学价值。未经专家视觉检查,容易导致不恰当的预处理,产生预处理不足(IPE)或过度预处理(EPE)的EEG。然而,关于IPE或EPE对时域、频域和空间域后处理的影响知之甚少,特别是对频谱和功能连接分析的影响。本研究基于纽约头模型和多变量自回归模型合成了具有线性和准平稳假设的干净EEG(CE)作为基准。随后通过注入高斯噪声模拟IPE,通过丢失脑成分模拟EPE。所有EEG的频谱同质性通过提出的并行对数谱指数(PaLOSi)评估。然后通过IPE/EPE与CE在时域统计量、多通道功率、交叉谱、头皮EEG网络特性和源分散度等方面的偏差量化对后处理的影响。最后分析了PaLOSi与后处理结果变化趋势的关联。研究发现:1)IPE(EPE)时域统计量随噪声增加(脑活动丢失)而更大程度偏离CE;2)IPE功率较高(EPE较低),IPE功率几乎与CE平行,而EPE功率偏差随频率升高而减小;3)基于7种耦合度量,IPE(EPE)网络具有较低(较高)的传输效率和较差(较好)的整合能力;4)IPE源分布更分散且强度更大,而EPE源激活更集中且幅度更低;5)PaLOSi与模拟和真实数据的后处理变化趋势持续相关。本研究揭示了预处理状态如何影响后处理结果,PaLOSi是创建标准化EEG数据库的有前景的质量控制指标。
1. 引言
静息态脑电图(rsEEG)是在没有外部任务或刺激的情况下由宏观神经团产生的自发神经活动。神经振荡通过不同频率在功能上塑造局部同步和区域间连接。定量EEG(qEEG)指使用无伪迹时段分析rsEEG的频率和地形特征,并测量其与健康人群标准化数据库的偏差,用于个体诊断、预后和神经反馈。大型标准化EEG数据库的质量决定了qEEG统计功效的敏感性、特异性和可靠性。最近已有若干尝试从信号区域到全球层面构建标准化数据库。不幸的是,微弱的EEG信号容易受到生理伪迹(如眨眼、肌肉活动)和非生理信号(如电干扰和外部环境因素)的污染。这些伪迹最终可能降低EEG标准的效力。因此,在预处理阶段必须清除伪迹并校正记录,同时进行质量评估。大型EEG需要从手动拒绝到全自动校正的预处理。
自动预处理流程已大量涌现,以处理大型EEG的复杂和异质性,如哈佛EEG自动处理流程(HAPPE)、批量EEG自动处理平台(BEAPP)、自动预处理流程(APP)、计算自动预处理测试(CTAP)、PREP、Automagic和EEG集成平台无损(EEG-IP-L)等。通常,独立成分分析(ICA)是这些流程和EEG伪迹去除工具的主要方法,假设噪声和脑信号之间独立。它首先将EEG记录分解为独立成分(ICs),然后通过丢弃非脑ICs重建伪迹子空间,被证明在EEG去噪中有效。预处理流程通常支持降采样、去趋势、DC去除、滤波、参考、噪声IC去除、坏通道检测和插值等步骤进行清理,并提供质量评估指标。实际上,即使对预处理步骤有普遍共识,策略上的微小变化仍可能导致显著影响。尽管现有的预处理流程和去噪算法日益成熟,但客观质量控制仍然悬而未决,这就提出了一个问题:预处理如何影响后处理结果。我们认为质量控制是连接上游预处理和下游后处理的桥梁,但仍是待解决的瓶颈。
2. 材料与方法
2.1 干净EEG的生成
图1提供了EEG数据生成的概述。纯粹的干净EEG(CE)几乎未知,但长期以来被数据分析师追求。CE是通过不考虑传感器噪声的EEG正向模型合成的。最先进的EEG模拟工具包括使用个体头模型的EEGsourceSim、利用有限元体积导体的EEG连接模拟框架,以及可以模拟平稳、非平稳时间序列、标准频谱特性和眨眼伪迹的SEED-G。这里我们改编了SEED-G的部分代码进行CE模拟。
2.2 实际预处理EEG状态
离线预处理以获得CE是识别噪声,然后通过自动预处理工具或专家手动选择从原始记录中拒绝坏时段/成分。然而,预处理程度缺乏客观标准。相比之下,常见状态是预处理不足的EEG(IPE),即预处理没有完全清除噪声。另一个容易被忽视的状态是过度预处理的EEG(EPE),即在去噪过程中无意中丢弃或过度校正了脑活动,特别是当应用强大的统计方法时,如ICA、PCA、坏通道去除/插值、鲁棒平均参考。最近的几项研究表明,ICA的不完美成分分离、隔离和反投影可能导致神经活动的过度校正/去除。通过注入不同强度的高斯噪声模拟IPE,通过丢失不同解释方差的脑成分模拟EPE。
3.主要结果
3.1 对时域测量的影响
图2显示了9种预处理状态下时域分析与CE的偏差3D图。x、y、z轴分别表示时域测量、预处理状态和通过黎曼距离量化的时域偏差(TD)。在条形图中,暖(冷)色代表IPE(EPE)。以dB为单位的数字表示IPE SNR,百分比表示SDR,即EPE信号丢失程度。
显然,COV在4种调查测量中产生最小的TD,且COV的TD对所有预处理状态一致<0.2。PEC、AEC和COR的TD比COV大得多且变化更剧烈。此外,所有TDs的偏差均呈现一致的增长趋势:无论是IPE中SNR降低,还是EPE中SDR升高。这表明时域分析会因去噪不充分或脑活动丢失而更显著偏离CE。此外,在固定SDR的EPE状态下,TDs遵循COV<COR<AEC<PEC的规律,而IPE状态下的TDs则无此关联性。综上,预处理状态对时域分析具有显著影响——时域多元相关性受预处理影响不可忽视,但COV可能对不当预处理具有免疫性。
3.2 对频谱测量的影响
图3A展示了功率偏差(PD)曲线,其x轴为1-40Hz频率范围,y轴为dB单位。这些曲线反映了不同预处理状态下功率相对于干净EEG(CE)在各频率点的偏离程度。颜色对应底部图例所示的9种预处理状态。灰色0基准线表示CE自身功率(无偏差),±PD分别表示功率高于/低于CE功率。预处理不足的EEG(IPE)因信噪比(SNR)降低(保留更多噪声)呈现更高功率,而过度预处理的EEG(EPE)因信号失真比(SDR)升高(丢失更多脑活动)呈现更低功率。暖色调曲线近乎平行且平坦,表明IPE的功率偏差基本不受频率影响。与之相反,冷色调曲线从低频到高频逐渐向0基准线收敛,意味着高频功率受脑信号去除的影响较小——换言之,EPE对低频功率的削弱效应更为显著。
图3B以条形图形式展示了交叉谱偏差(CD)及其在重复实验中的标准差。CD是通过计算各预处理状态与干净EEG(CE)在限频带范围内的交叉谱矩阵之间的平均黎曼距离得出的。在所有频段中,CD值均呈现一致的增长趋势:无论是预处理不足(IPE)导致信噪比(SNR)降低(MIP),还是过度预处理(EPE)导致信号失真比(SDR)升高(MEP)。这表明交叉谱会因传感器噪声增加或脑信号丢失而更显著偏离CE基准。需特别注意的是,在δ至α频段,IPE的CD值普遍高于EPE;而在β频段则相反,IPE的CD值低于EPE。这可能暗示IPE对低频段的交叉谱偏差影响更大。此外,IPE的CD值从低频到高频逐渐降低,而EPE的CD值在各频段间无明显差异。本质上,不彻底的噪声去除主要影响低频CD值,而脑活动丢失对四个频段的影响则相对均衡。
3.3 对EEG网络的影响
图4展示了δ至β频段内,基于相位锁定值(PLV)的功能连接(FC)矩阵在预处理不足(IPE)和过度预处理(EPE)状态下相对于干净EEG(CE)的偏差(DEVI)。该偏差是通过计算各预处理状态与CE在限频带范围内FC矩阵的平均SimiNet距离得到的。可以明显观察到,无论是更不充分的预处理(MIP)还是更过度的预处理(MEP),FC矩阵的DEVI均呈现增大的趋势,且这一现象在所有4个频段中均保持一致。然而,冷色调的EPE数据框(箱线图)比暖色调的IPE数据框分布更为集中,而IPE数据框的离散程度则明显高于EPE数据框。这可能表明,冗余的传感器噪声会显著扭曲FC模式,而微弱的传感器噪声可能不会对FC模式产生明显影响;相反,脑信号的丢失会更容易导致FC模式失真。由于DEVI在不同频段间无明显差异,后续针对图论指标的偏差分析将聚焦于α频段。
图5展示了9种预处理状态对基于7种耦合度量计算得到的网络指标(包括特征路径长度CPL、聚类系数CC、全局效率GE和局部效率LE)的影响。针对每种耦合度量,网络指标随预处理状态变化的趋势均通过连接数据点的曲线呈现。除虚部相干iCOH外,CPL、CC、GE和LE在不同耦合度量中均表现出与EEG预处理状态高度一致的关联趋势:随着预处理从不足(IPE)发展到过度(EPE),CPL呈下降趋势,而CC、GE和LE则同步上升。值得注意的是,有向传递函数DTF-部分定向相干PDC曲线组与相干性COH-相位锁定值PLV曲线组几乎完全重合,这一现象可通过数学公式进行理论推导。在四种网络指标中,iCOH对应的曲线均呈现近乎水平的趋势,表明基于iCOH的图论指标可能对传感器噪声污染和脑活动丢失均不敏感。除CPL普遍呈现IPE到EPE的下降趋势外,CC、GE和LE则呈现相反的上升趋势。具体而言,针对每种预处理状态:CC、GE和LE的数值排序均为GC<PSI<iCOH<PDC≈DTF<PLV≈COH,而CPL则呈现完全相反的排序规律。
3.4 对源分散度(source dispersion)的影响
图6A展示了4个频段下9种预处理状态归一化后的源活动模式分布。中间列显示为干净EEG(CE)的源重建结果。与CE相比,预处理不足(IPE)的源活动分布更分散且亮度更高(信噪比SNR降低,MIP);而过度预处理(EPE)的源活动分布更集中且更暗(信号丢失率SDR增加,MEP)。图6B汇总了9种预处理状态下的源分布标准差(SD)。需注意,SD评估的是重建源活动的离散程度,而非与真实位置的定位误差。与CE相比,无论是IPE还是EPE,随着SNR或SDR的增加,SD值均呈下降趋势。CE的SD约为6 cm,表明模拟中CE的源分布存在一定弥散性(smearing),这是由于从79个布罗德曼区随机选取15个感兴趣区(ROI)覆盖了广泛的皮层区域。在4个频段中,EPE的SD变化幅度均大于IPE:当SNR降低时,SD趋近7 cm;而当SDR增加时,SD可降至4 cm。这表明,保留更多传感器噪声会导致源活动更弥散(spurious and smearing),而脑信号丢失则会使源分布更集中(focal)。换言之,过度预处理(MEP)对源稀疏性的影响更大,而预处理不足(MIP)则会导致源分布更弥散。简言之,SD对脑信号丢失的敏感性高于对传感器噪声的敏感性。此外,4个频段的SD结果表现均衡。
3.5. PaLOSi-后处理关联分析
图8A展示了模拟200份EEG数据中PaLOSi指标随9种预处理状态的变化趋势。可以观察到:在预处理不足(IPE)阶段,PaLOSi随着信噪比(SNR)的升高呈指数增长;在标准预处理(CE)附近趋于稳定;而在过度预处理(EPE)阶段,PaLOSi随着信号丢失率(SDR)的增大再次呈现指数上升。IPE的PaLOSi值始终低于CE,而EPE则高于CE,表明PaLOSi与预处理程度呈正相关——保留更多传感器噪声(MIP)会导致PaLOSi降低,而丢失更多脑活动信号(MEP)则使其升高。
图8B从时域、频域和空域三个维度展示了偏差变化情况。行方向(预处理状态)按SNR从低到高(5/8/11/14 dB)和SDR从低到高(20%/40%/55%/70%)排列,最右侧显示PaLOSi值。列方向(后处理指标)显示时域和空域偏差的变化幅度显著大于频域偏差。相关性分析表明,PaLOSi与大多数时-空域偏差(COR/AEC/PEC; DEVI/CC/GE/LE)的Pearson相关系数接近0.85,而与频域偏差的相关系数约为0.55(所有P<0.001)。这表明PaLOSi与所有后处理指标均存在显著正相关,验证了其作为有效指标用于控制预处理质量偏差和后处理偏差的可行性。
4. 结论
本研究系统评估了预处理状态对后处理的影响,发现:预处理不足和过度都会引入偏差,脑信号丢失的影响可能比噪声保留更严重,PaLOSi是有效的质量评估指标。PaLOSi作为新型预处理质量指标,能有效反映后处理结果的偏差。建议预处理时在保证脑信号不丢失的前提下适当去除伪迹,使PaLOSi保持在0.3-0.6范围内。
参考文献:How do the resting EEG preprocessing states affect the outcomes of postprocessing?
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。