Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >NC:深度学习在神经影像数据分析中优于机器学习

NC:深度学习在神经影像数据分析中优于机器学习

原创
作者头像
悦影科技
发布于 2025-05-28 03:06:18
发布于 2025-05-28 03:06:18
1060
举报

最近的评论将深度学习(DL)与用于大脑成像数据分析的标准机器学习(SML)方法进行了不利的比较。然而,他们的结论往往基于预先设计的特征,剥夺了DL的主要优势——表征学习。我们在多个分类和回归任务上对结构MRI图像进行了一项大规模系统性比较,并显示了表征学习对DL的重要性。结果表明,如果按照流行的DL实践进行训练,DL方法具有特别好的扩展潜力,与SML方法相比有很大的改进,同时也在相对计算时间内呈现出较低的渐近复杂度,尽管它更复杂。我们还证明,DL嵌入跨越了可理解的任务特异性投射谱,并且DL始终定位任务-识别的脑生物标记物。我们的发现强调了神经成像数据中非线性的存在,DL可以利用这些数据生成更好的任务区分生物表示来表征人类大脑。

1.简介

机器学习在神经系统和精神疾病的研究中的应用在过去的二十年中有了很大的发展。标准机器学习(SML)方法通过使用推理规则操纵特定的线性或非线性预测函数来预测健康相关结果SML方法不学习表示,而是确定本身、核转换的或特性工程输入空间中的决策边界。事实上,这是SML方法在建模大脑数据时最显著的局限性之一。提高SML方法性能的一个必不可少的先决条件是降低输入空间的维数,通常通过手工或专家设计的特征选择(即,识别捕获数据中大部分信息的变量子集)和/或特征提取(即,通过一些线性或非线性数据转换将特征投影到较低维空间)技术实现。这一初步步骤带来的持续挑战为引入深度学习(DL)方法铺平了道路。相反,DL方法可以利用从最少预处理的输入图像中获得的丰富信息来描述输入数据中固有的微妙模式,将其作为训练过程的一个组成部分。DL方法的训练阶段通常涉及到在端到端(输入到输出)学习过程中,在多层层次上自动和自适应地发现判别数据表示。这种截然不同的方法在端到端方式上的应用还可以通过有条理的解释提供到输入图像空间的逆向映射,因此可能允许我们对大脑机制进行推断,例如,描述输入空间中对预测尝试任务最有影响的特征。相反,相关的空间关系可能在降维阶段丢失,可以说,这是SML方法工作所必需的。与人工设计的方法和计算机视觉领域的几种自动降维技术相比,DL方法在学习更具辨别性的数据编码(即表示)方面取得了成功。

在这项工作中,我们在结构化脑成像数据的原则性比较分析中纠正了之前基准的上述缺陷,并展示了DL的表示学习部分对其性能的重要性。为此,我们利用结构磁共振成像(sMRI)图像的大数据集,系统地分析了基于10种年龄和性别的分类任务中几种SML和DL方法的分类性能和经验时间复杂性。我们对一系列训练样本量进行了这种比较,以比较和对比两种方法在性能改进和相对时间复杂度方面的渐近行为。此外,我们通过评估基于这些特征训练的SML方法的性能,来探讨DL嵌入任务鉴别能力的一致性。我们还验证了在其他任务上观察到的性能趋势,包括性别分类任务、年龄回归任务和迷你精神状态检查(MMSE)回归任务。此外,为了确认我们结果的可重复性,我们对我们的DL模型和训练管道与最近研究中提出的进行了广泛的比较。最后,我们通过事后分析来评估验证的任务特异性DL模型的一致性和鲁棒性,并通过模型内省来探讨任务特异性大脑区域的合理性。

评估我们的关键目标和这项工作中承担的任务的选择是由学习MRI与年龄和性别相关的高科学效用以及评估患者群体中独立认知任务的表现的需要所驱动的。特别是,年龄预测是一个流行的代理基准,用于确定其他科学上令人兴奋的问题,如认知功能、精神障碍等。同样,性别也可能显著影响认知功能,包括记忆、情感、感知等,并在这方面得到了广泛研究。此外,基于这些鉴别变量的模型的方法比较更有意义,当使用具有高鉴别性能的模型时,而不是使用训练为随机性能的模型时,会带来更多的价值。最后,尽管我们的研究结果显示了为尝试的样本任务和脑成像模态拟合判别分类器或回归量的最佳表现方法,但类似的分析可以扩展到其他推理任务和模态。接下来,我们将介绍我们探索性工作的发现。

2.结果

2.1 DL有更具辨别性的特征

我们系统地评估了SML和DL模型的性能(通过准确性和运行时间衡量)如何作为训练样本量的函数,在一个10类年龄和性别分类任务(即,每个性别的5个年龄组)中,在一个标准重复(n = 20),分层交叉验证(CV)程序中进行评估,如图1所示。我们使用了从12,314名未受影响(即没有诊断或自我报告精神疾病的受试者)的sMRI数据中提取的灰质体积图进行评估。为了建立SML方法的性能基线,我们纳入三种线性SML模型——线性判别分析(LDA),逻辑回归(LR)和线性核支持向量机(SVML)和三种非线性SML模型——支持向量机(SVMP),径向基函数(SVMR)和s型曲线(SVMS)核。此外,我们测试了两个非线性DL模型,它们都是AlexNet架构的3D CNN变体,主要不同于网络深度(depthDL2 vs depthDL1)和卷积层中的通道数。考虑到特征提取是提高线性和基于核的SML方法性能的必不可少的措施,我们使用三个维度的约简方法来减少灰质图:高斯随机投影(GRP)、递归特征消除(RFE)和单变量特征选择(UFS),如方法部分所述。我们直接在三维灰质图的未约简输入空间上训练DL体系结构,以充分利用其表征能力。

图片
图片

图1 系统比较SML和DL方法的分类和回归性能。

我们发现,在每个减少的特征空间上,两个DL模型的表现明显优于SML模型(图2a)。对于最高样本量(n = 10,000), DL模型报告的10类分类准确率分别为58.19% (DL1)和58.22% (DL2)(注意,该任务的机会概率为10%)。相比之下,SVMS和LDA模型对GRP (SVMS: 51.15%)、RFE (LDA: 45.77%)和UFS (LDA: 44.07%)特征的准确率最高。事实上,GRP方法对所有SML模型产生了最具鉴别性的特征,其次是RFE方法。尽管随着训练样本量的增加,两个DL模型一致报告了显著的改善,但这一观察结果对SML模型并不一定是正确的。例如,LDA在GRP特征上的性能最初下降,可能是由于训练样本量小于验证和测试数据量。此外,与稀疏模型的预期一样,当训练样本量从n = 5000增加到n = 10,000时,对于RFE特征,SVMP和UFS特征的SVML和SVMS的性能没有观察到明显的改善。有趣的是,在相同的训练样本量下,我们的SML基线也大大高于Schulz等人的SML基线。这一观察结果可能是由于(1)SML求解器用于收敛的最大迭代次数的参数的差异(我们允许10000次迭代进行收敛,相比之下,比较工作中的100或1000次,从而增加了我们运行中的收敛概率),(2)预处理的差异(例如,平滑核大小、灰质掩模和输入数据,即原始和调制灰质概率图像),(3)验证/测试数据大小(例如,我们的研究为1157,而比较工作为650,从而使我们的SML模型具有更好的泛化优势),但这些差异仍有待确认。尽管SML基线有了改进,但我们的结果显示DL在这项任务上明显优于SML。

有趣的是,DL模型的性能改进表现出类似于SML方法的渐近行为,尽管性能显著提高。也就是说,对于DL方法来说,性能的提高正在放缓,尽管模型确实在继续改进。减速是否有影响以及收益递减点在哪里发生取决于应用程序。我们的观察需要进一步的确认,因为有许多方法可以通过测试更深入的模型、调整现有的DL模型和探索其他DL方法来获得进一步的性能提升。此外,如果DL模型确实一致地提取了更好的(即更有鉴别力)特征,那么,与三种测试的降维方法相比,由它们生成的低维编码作为SML模型的输入特征应该会显著提高性能。为了确定这一点,我们进行了事后分析,评估了SML模型对来自DL1模型的训练编码的性能(即DL1中第一个全连接层的输出)。正如预期的那样,我们观察到应用于测试数据的SML方法的性能有了显著的提高,这证明了如果使用DL编码的特征空间,SML方法也可以同样出色地执行(图2a)。

我们对一些分类和回归任务进行了额外的比较分析,以进一步验证SML和DL方法在从脑成像数据学习方面的比较性能。对于性别分类任务(图2b),在最大的训练样本量(n = 10,000)下,DL1分类模型的平均分类准确率为98.34%,显著提高优于性能最佳的SML分类方法(即GRP特征的LDA方法,报告的准确性为97.45%)。对于这两个回归任务,我们开发并测试了一个基于DL1分类模型的深度香草回归框架(DL3)来预测年龄和MMSE得分。在这些回归任务中,我们比较了我们的DL回归模型与SML回归方法的性能,包括弹性网(EN),核岭回归(KRR)和随机森林(RF)集成学习。为了量化这两个回归任务中的性能,我们依赖两个性能指标:(1)感兴趣的真实值和预测值之间的平均绝对误差(MAE)和(2)这些值之间的皮尔逊相关系数(PCC)。我们对年龄回归任务的结果(图2b)报告了一个显著较低的MAE,DL模型的预测年龄与真实年龄之间的PCC显著较高与性能最佳的SML回归方法相比。同样,我们在MMSE回归任务上的结果(图2c)报告了一个显著较低的MAE,DL模型的预测MMSE值与真实MMSE值之间的PCC显著升高与性能最佳的SML回归方法相比。值得注意的是,我们在回归任务上的结果表明,除了做出卓越的分类预测(即分类任务)外,DL模型中的表征学习可能有助于学习神经影像学临床数据中更精确的连续尺度(即回归任务)。

图片
图片

图2 DL在多个分类和回归任务中具有更强的鉴别能力。

2.2 DL在相对计算时间上表现出较低的经验渐近复杂度

机器学习算法的理论和经验计算时间复杂性不是当前临床应用的关键考虑因素,因为推理通常应用于患者级别。相反,我们比较了SML和DL方法的标准实现的计算时间复杂性,以解决DL方法的标准实现具有很高的计算时间复杂性和运行时间长这一反应不一致的问题。相比之下,标准的、基于cpu的SML在大型训练数据集上的高计算复杂度增长常常被忽视。事实上,这一论证在神经成像界的现阶段是至关重要的,因为研究人员可能会被阻止使用基于这种反动但不准确的反应的DL方法。

因此,我们寻求经验证据,以确定在基于年龄和性别的分类任务中,两类方法的计算时间增长与训练样本量的函数关系。图3a给出了所有测试模型的平均计算时间。这一对比说明了大多数SML模型的计算时间的更高增长率,因为两类模型的记录差异随着除LDA以外的所有SML模型的训练样本量的增加而减小。此外,为了确认这一观察结果是否确实意味着DL模型的经验渐近复杂度较低,我们通过用最小训练样本量的计算时间归一化计算时间来估计一个相对计算增长率度量。该分析的结果(图3b)是一个经验证据,表明与除LDA以外的所有SML模型相比,DL模型的计算复杂度增长率较低。

图片
图片

图3 计算时间复杂度的系统比较。

2.3 DL学习了跨越可理解投影谱的有意义的大脑表征

如果DL方法确实是表示低维空间中的大脑的学习嵌入,那么更深层次(离输入更远)中的编码必须对尝试的任务具有鉴别性。因此,对于本工作中承担的基于年龄和性别的分类任务,我们可以期望推断的DL编码从高维输入数据中捕获有意义的年龄和性别信息。此外,随着训练样本量的增加,我们可以在捕获的模式中预测这些信息并不断提取。为了验证这一说法,我们进行了一项后置分析,通过使用t分布随机邻居嵌入(t-SNE)将学习到的DL1嵌入(即DL1体系结构中第一个完全连接层的输出)投影到二维空间,用于整个训练样本大小范围,并通过类标签对二维投影谱进行颜色编码。t-SNE算法致力于放置二维表示,最大限度地保持它们在原始空间中的距离;因此,如果嵌入包含明显的年龄和性别信息,则预期相同性别和年龄相似的受试者最终会出现在附近。图4a中学习到的DL表示的t-SNE布局显示,随着训练样本量的增加,随着显式双模态结构(即形成两个不同的性别聚类)的逐步演化,学习到的模式得到了有意义的细化,这两种模式都表现出可理解的、逐渐的年龄谱。更具体地说,我们可以看到,随着年龄的增长,从谱的一端到另一端有不同的性别集群,尽管确实存在一些异常值的观察。

图片
图片

图4 从验证的DL模型的嵌入投影。

推理嵌入在其他三个学习任务中的非线性投影也呈现出全面的趋势,进一步验证了DL方法中学习推理过程的合理性。性别分类任务显示出不同的集群,很少有异常值(图4b)。此外,在进行的年龄和MMSE回归任务中,分别观察到随着年龄增加的连续渐进谱(图4c)和从谱一端到另一端的MMSE(图4d)值。因此,我们可以得出结论,所实现的方法确实能够从脑成像数据中学习到感兴趣的任务特定表征模式。

2.4 DL可以对人脑区域进行稳健的相关性估计

验证算法鲁棒性的一个关键维度是在独立重复中预测的相似性。因此,我们试图确定经过验证的DL模型是否在其独立运行中以一致的模式估计分类决策中的大脑区域的预测相关性。

图5a显示了基于这些方法在自动解剖标记(AAL)大脑图谱上计算的最高样本量的任务识别相关性百分比。尽管合并的大脑网络的排序顺序有一些差异,但两种显著性方法对大多数大脑网络估计的预测水平相似。图5b显示了两种方法的AAL脑图谱的平均相关性估计,以及比较两种方法的这些指标的散点图(r = 0.921)。总的来说,这些初步结果清楚地表明相关性估计的稳稳性,因此采用DL方法记录脑成像数据的一致表示具有很高的潜力。鉴于这些积极的证据,未来DL应用于脑成像数据应该研究将显著性映射更全面地纳入学习公式。

图片
图片

图5 网络遮挡敏感性分析(NOSA)和梯度反向传播(GBP)方法的AAL图谱的任务判别相关性估计,用于年龄和性别分类任务。

2.5 DL揭示了辨别性生物标志物的合理任务特异性相关性分布

在这里,我们执行DL模型内省,定性地评估每个承担的学习任务中最具辨别能力的大脑区域,并讨论这些发现与文献中先前发现之间的关系。如图6a所示,年龄和性别联合分类任务的聚集显著图的特征区域分布在(1)岛叶皮层和壳核、扣带回中和前回的中心结构,(2)颞叶包括海马、海马旁回、杏仁核、梭状回、Heschl回和颞下回/中/上回,(3)枕叶包括距状裂、楔叶、舌回,枕下回/中/上回和角回,(4)额叶,包括罗兰盖、额上回和中回、额下回眶部和额下回和中央前回,(5)顶叶,包括楔前叶回、缘上回、中央后回和顶叶下回,(6)小脑(4/5/6/8/Crus1)。正如我们接下来将看到的,这些激活显示出与先前报道的性别相关(图6b)和年龄相关(图6c)灰质差异模式高度一致。

图片
图片

图6 辨别性生物标记物的任务特异性分布的可视化。

2.6 比较分析证实了脑成像数据的可重复性DL

图7显示了我们的结果(使用我们的模型和管道)可以通过使用Peng等人最初提出的模型和管道,使用我们的代码以及Schulz等人的代码来再现。具体来说,与我们的DL1 Abrol@/DL3 Abrol@管道(分类/回归)相比,SFCN Abrol@、SFCN Schulz@和SFCN Schulz_C*管道的所有度量指标都观察到了高度相似的性能,这是对SML方法性能的显著改进。从这些结果中很容易注意到,年龄回归任务中唯一显著的变化是SFCN Schulz*的R2度量,对于相应的校正管道(即SFCN Schulz_C*),该度量被校正为更高的值。在DL1 Abrol@/DL3 Abrol@、SFCN Abrol@、SFCN Schulz@和SFCN Schulz_C*管道之间仍然存在一些性能差异,这可能是由于DL方法训练的随机性质和训练管道中的参数差异造成的。总的来说,这种比较分析使我们能够深入了解可重复性研究,证实了考虑的DL模型和神经成像数据管道在性能上的相似性。

图片
图片

图7 比较分析证实了脑成像数据的重复性DL研究。

3.讨论

我们的结果表明,DL方法,如果按照常见的实践实现和训练,有潜力大大优于SML方法,并在相对计算时间内表现出较低的渐近复杂度,尽管其体系结构和参数化更复杂。在性能图中观察到大量的边缘,这与研究的任务关联嵌入在复杂成像数据中复杂的抽象层次的概念是一致的,因此可以受益于DL方法的表征能力。我们进一步证实了这一概念,证明了优越的特征提取有助于DL方法的出色性能,如果我们在DL表示上训练SML方法,它们也可以同样出色地执行。因此,我们强烈建议未来使用DL方法来评估最小预处理输入空间中可用的时空信息的财富,而不是使用减少的特征空间。注意,我们在这里并没有发现什么新东西,DL领域不仅意识到模型的这一属性,而且可以说它们是以此作为主要目标开发的。我们的分析还表明,作为训练样本量的函数,DL方法的性能改进最终与SML方法相似,虽然在一个显著更高的性能标记上饱和。尽管在本工作中测试的深度DL方法的更深变体训练速度更快,但它并没有带来显著的性能改善,因此需要进一步的探测来确认额外的深度是否可以进一步提高DL模型的性能。我们在这里注意到,尽管如此,除了试验被测试的DL模型类的更深层变体之外,还有许多可能获得进一步性能提升的途径,例如,探索微调过程中的变体和测试其他现有或更新的DL框架。事实上,在脑成像数据上对大量不同的有监督和无监督DL框架的性能和可伸缩性边界进行基准测试将是非常有趣的。

从本质上说,我们的发现强调了大脑成像数据中非线性的存在,DL框架可以利用这些非线性来生成更有区别的编码来描述人类大脑。结果支持DL应用于脑成像数据的潜力,即使在目前可用的数据大小下;然而,关于DL方法的无限可扩展性的现有主张/推测需要进一步证实。我们的发现激励了未来的脑成像DL工作,专注于提高编码的辨别能力,并通过有方法的模型解释促进更精确的辨别特征定位。值得注意的是,DL模型的鉴别能力更容易评估,但这并不是唯一的,可以说是可以从它们中受益的主要用途。许多其他应用,如分割和多模态数据集成,直接受益于DL方法的表示能力和模型构建的方便性。与其专注于显示DL在某些情况下不能很好地预测,我们还不如利用这些模型的灵活性,在当前主力SML方法无法进一步推动的脑成像问题上取得巨大进展。

参考文献:Deep learning encodes robust discriminative neuroimaging representations to outperform standard machine learning.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
脑影像中的深度学习研究:前景与挑战
深度学习(DL)在应用于自然图像分析时非常成功。相比之下,将其用于神经影像学数据分析时则存在一些独特的挑战,包括更高的维度、更小的样本量、多种异质模态以及有限的真实标签(ground truth)。在本文中结合神经影像学领域的四个不同且重要的类别讨论了DL方法:分类/预测、动态活动/连接性、多模态融合和解释/可视化。本文重点介绍了这些类别中每一类的最新进展,讨论了将数据特征和模型架构相结合的益处,并依据这些内容提出了在神经影像学数据中使用DL的指南。对于每一个类别,还评估了有希望的应用和需要克服的主要挑战。最后讨论了神经影像学DL临床应用的未来方向。
用户1279583
2022/04/12
1.2K0
脑影像中的深度学习研究:前景与挑战
深度学习在静息态功能磁共振成像中的应用
对从人脑功能磁共振成像(fMRI)数据中获得的丰富的动态的时空变化特性进行建模是一项具有挑战性的任务。对大脑区域和连接水平进行分析为fMRI数据提供了更直接的生物学解释,并且到目前为止一直有助于描述大脑中的特征。在本文中作者假设,与之前研究广泛使用的预先进行的fMRI时变信息转换以及脑区之间的功能连接特征相比,直接在四维(4D)fMRI体素级别空间中进行时空特征的学习可以增强大脑表征的鉴别性。基于这个目的,作者对最近提出的结构MRI(sMRI)深度学习(DL)方法进行扩展,以额外获得时变信息和在预处理好的fMRI数据上对提出的4D深度学习模型进行训练。结果表明使用基于复杂的非线性函数的深度时空方法为学习任务生成具有鉴别性的编码,使用fMRI体素/脑区/功能连接特征对模型进行验证,发现本文方法的分类性能优于传统标准机器学习(SML)和DL方法,除了相对简单的集中趋势测量的fMRI数据的时间平均值。此外,作者探讨了不同方法识别fMRI特征的优劣,其中对于fMRI体素级别特征DL显著优于SML方法。总之作者的研究结果体现了在fMRI体素级别数据上训练的DL模型的效率和潜力,并强调了开发辅助工具的重要性,以促进对这种灵活模型的解释。本文发表在IEEE Engineering in Medicine & Biology Society (EMBC)
用户1279583
2022/06/13
1.5K1
深度学习在静息态功能磁共振成像中的应用
通过深度多任务多通道学习的联合分类和回归用于阿尔茨海默病的诊断
工作:为此,我们提出了一个深度多任务多通道学习 (DM2L) 框架,用于同时进行脑疾病分类和临床评分回归,使用 MRI 数据和受试者的人口统计信息。
Shine_smile
2022/03/09
2.2K0
Nat. Commun | 利用深度学习预测脑年龄
今天给大家介绍Stefansson与Ulfarsson等人在Nature Communications volume上发表的文章“Brain age prediction using deep learning uncovers associated sequence variants”。一个人的预测年龄和实际年龄之间的差异,即预测年龄差(PAD),是与衰老和脑部疾病相关的一种表型。作者通过深度学习的方法根据大脑结构磁共振成像(MRI)估计年龄,该方法在一个健康的冰岛人的数据集上进行了训练,并利用迁移学习在两个数据集:IXI和UK Biobank上进行了测试,得到了较理想的预测结果。在UK Biobank中,对PAD进行全基因组关联分析(GWAS),发现了与脑结构相关的序列变体。
智能生信
2021/02/04
2K0
SVM在脑影像数据中的应用
如第一章所述,机器学习中有四种基本方法:有监督学习、无监督学习、半监督学习和强化学习。分类是监督学习的一种形式,它根据训练阶段确定的许多输入输出对将输入数据映射到输出数据。使用分类,与一组示例观察相关的特征可以用来训练一个决策函数,该函数以给定的精度生成类别赋值(即标签labels)。从功能性神经成像数据到推特帖子,这些特征可以是多种多样的。一旦基于这些特征创建了决策函数分类器,它就可以使用之前建立的模式自动将类标签附加到新的、不可见的观察结果上。有许多类型的机器学习算法可以执行分类,如决策树,朴素贝叶斯和深度学习网络。本章回顾支持向量机(SVM)学习算法。支持向量机的强大之处在于它能够以平衡的准确性和再现性学习数据分类模式。虽然偶尔用于回归(见第7章),SVM已成为一种广泛使用的分类工具,具有高度的通用性,扩展到多个数据科学场景,包括大脑疾病研究。
用户1279583
2022/02/28
1.2K0
SVM在脑影像数据中的应用
建立脑影像机器学习模型的step-by-step教程
机器学习的日益普及导致了一些工具的开发,旨在使这种方法的应用易于机器学习新手。这些努力已经产生了PRoNTo和NeuroMiner这样的工具,这并不需要任何编程技能。然而,尽管这些工具可能非常有用,但它们的简单性是以透明度和灵活性为代价的。学习如何编程一个机器学习管道(即使是一个简单的)是一个很好的方式来洞察这种分析方法的优势,以及沿着机器学习管道可能发生的扭曲。此外,它还允许更大的灵活性,如使用任何机器学习算法或感兴趣的数据模式。尽管学习如何为机器学习管道编程有明显的好处,但许多研究人员发现这样做很有挑战性,而且不知道如何着手。
用户1279583
2022/02/28
8590
建立脑影像机器学习模型的step-by-step教程
大脑年龄预测:机器学习工作流程的系统比较研究
脑解剖扫描预测的年龄和实际年龄之间的差异,如脑年龄增量,为非典型性衰老提供了一个指示。机器学习 (ML) 算法已被用于大脑年龄的估计,然而这些算法的性能,包括(1)数据集内的准确性,  (2)跨数据集的泛化,  (3)重新测试的可靠性,和(4)纵向一致性仍然没有确定可比较的标准。本研究评估了128个工作流程,其中包括来自灰质 (GM) 图像的16个特征和8个具有不同归纳偏差的ML算法。利用四个覆盖成人寿命的大型神经成像数据库进行分析 (总N=2953,18-88岁),显示了包含4.73—8.38年的数据集中平均绝对误差 (MAE ) ,其中32个广泛抽样的工作流显示了包含5.23—8.98年的交叉数据集的MAE。结果得到:前10个工作流程的重测信度和纵向一致性具有可比性。特征的选择和ML算法都影响了性能。具体来说,体素级特征空间 (平滑和重采样) ,有和没有主成分分析,非线性和基于核的ML算法表现良好。在数据集内和跨数据集内的预测之间,大脑年龄增量与行为测量的相关性不一致。在ADNI样本上应用表现最佳的工作流程显示,与健康对照组相比,阿尔茨海默病患者和轻度认知障碍患者的脑龄增量明显高于健康对照组。在存在年龄偏倚的情况下,患者的脑龄增量估计因用于偏倚校正的样本而不同。总之,大脑年龄具有一定应用前景,但还需要进一步的评估和改进。
悦影科技
2023/06/25
7660
BrainAGE作为大脑老化的神经影像标志物的十年
随着人口老龄化,神经退行性疾病的发病率越来越高,给个人和整个社会带来越来越大的负担。然而,个体的衰老速度是由环境、基因和表观遗传等各种因素以及各因素间的相互作用决定的。建立神经解剖学衰老过程的生物标志物,是神经科学的一个新趋势,以便在个体水平上,对年龄相关性神经退行性疾病和神经精神疾病进行风险评估和预测。“脑年龄差距估计(Brain Age Gap Estimation,BrainAGE)”方法是基于结构MRI,预测和评估个体脑龄的首个也是实际应用最广泛的概念。本文总结了过去10年内发表的所有研究,这些研究建立并使用BrainAGE方法来评估基因、环境、生活负担、疾病或寿命之间的相互作用,研究衰老对个体神经解剖学的影响。未来,基于结构或功能标记物的BrainAGE和其他脑年龄预测方法可能会改善对神经病学、神经精神病学和神经退行性疾病的个体风险的评估,并有助于开发个性化的神经保护治疗和干预措施。本文发表在Frontiers in Neurology杂志。
用户1279583
2022/02/28
7530
BrainAGE作为大脑老化的神经影像标志物的十年
Science Advances:基于生成式机器学习揭示自闭症的基因-大脑-行为联系
摘要:自闭症传统上是通过行为进行诊断的,然而它具有很强的遗传基础。以遗传学为优先的方法能够改变对自闭症的理解和治疗方式。但是,将基因 - 大脑 - 行为关系与混杂的变异来源分离开来是一项极具挑战的任务。我们展示了一种名为基于 3D 运输的形态测量法(TBM)的新技术,该技术可用于提取与 16p11.2 区域的遗传拷贝数变异(CNV)相关的大脑结构变化。我们确定了两种不同的内表型。在来自 Simons 个体变异项目的数据中,这些内表型的检测使得仅从脑图像预测 16p11.2 CNV 的测试准确性达到 89%至 95%。此外,TBM 能够直接可视化内表型,从而推动实现准确预测,揭示出缺失和重复携带者之间存在剂量依赖性的大脑变化。这些内表型对发音障碍较为敏感,并能够解释部分智商的变异性。遗传分层与 TBM 相结合能够揭示许多神经发育障碍中的新脑内表型,加速精准医学的发展以及对人类神经多样性的理解。
悦影科技
2024/09/23
1760
Radiology:对阿兹海默和行为变异型额颞痴呆症的基于皮层萎缩的个体患者的自动诊断分类
请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论,也欢迎参加思影科技的其他课程。(文末点击浏览)
用户1279583
2019/08/09
6350
Radiology:对阿兹海默和行为变异型额颞痴呆症的基于皮层萎缩的个体患者的自动诊断分类
Molecular Psychiatry:神经影像机器学习对不同表型癫痫患者脑龄进行预测
请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论,也欢迎参加思影科技的其他课程。(文末点击浏览)
用户1279583
2019/07/30
9370
Molecular Psychiatry:神经影像机器学习对不同表型癫痫患者脑龄进行预测
机器学习与神经影像:评估它在精神病学中的应用
精神疾病是复杂的,涉及不同的症状学和神经生物学,很少涉及单一的、孤立的大脑结构的破坏。为了更好地描述和理解精神疾病的复杂性,研究人员越来越多地将多元模式分类方法应用于神经成像数据,特别是监督机器学习方法。然而,监督机器学习方法也有独特的挑战和权衡,需要额外的研究设计和解释考虑。本综述的目的是提供一套评估机器学习应用于精神障碍的最佳实践。我们将讨论如何评估两种共同的努力:1)作出可能有助于诊断、预后和治疗的预测;2)询问精神病理学背后复杂的神经生理机制。我们在这里重点讨论机器学习应用于功能连接与磁共振成像,作为一个基础讨论的例子。我们认为,为了使机器学习分类对个体水平的预测具有转化效用,研究人员必须确保分类具有临床信息性,独立于混杂变量,并对性能和泛化性进行适当评估。我们认为,要想揭示精神疾病的复杂机制,需要考虑机器学习方法识别的神经成像特征(如区域、网络、连接)的独特效用、可解释性和可靠性。最后,我们讨论了大型、多站点、公开可用的数据集的兴起如何有助于机器学习方法在精神病学中的应用。
悦影科技
2021/10/23
5700
BRAIN:用于阿尔茨海默病分类的可解释深度学习框架的开发和验证
阿尔茨海默症是全世界痴呆症的主要病因,随着人口老龄化,患病负担不断增加,在未来可能会超出社会的诊断和管理能力。目前的诊断方法结合患者病史、神经心理学检测和MRI来识别可能的病例,然而有效的做法仍然应用不一,缺乏敏感性和特异性。在这里,本文报告了一种可解释的深度学习策略,该策略从MRI、年龄、性别和简易智力状况检查量表(mini-mental state examination ,MMSE) 得分等多模式输入中描绘出独特的阿尔茨海默病特征(signatures)。该框架连接了一个完全卷积网络,该网络从局部大脑结构到多层感知器构建了疾病概率的高分辨率图,并对个体阿尔茨海默病风险进行了精确、直观的可视化,以达到准确诊断的目的。该模型使用临床诊断的阿尔茨海默病患者和认知正常的受试者进行训练,这些受试者来自阿尔茨海默病神经影像学倡议(ADNI)数据集(n = 417),并在三个独立的数据集上进行验证:澳大利亚老龄化影像、生物标志物和生活方式研究(AIBL)(n = 382)、弗雷明汉心脏研究(FHS)(n = 102)和国家阿尔茨海默病协调中心(NACC)(n = 582)。使用多模态输入的模型的性能在各数据集中是一致的,ADNI研究、AIBL、FHS研究和NACC数据集的平均曲线下面积值分别为0.996、0.974、0.876和0.954。此外,本文的方法超过了多机构执业神经科医生团队(n = 11)的诊断性能,通过密切跟踪死后组织病理学的损伤脑组织验证了模型和医生团队的预测结果。该框架提供了一种可适应临床的策略,用于使用常规可用的成像技术(如MRI)来生成用于阿尔茨海默病诊断的细微神经成像特征;以及将深度学习与人类疾病的病理生理过程联系起来的通用方法。本研究发表在BRAIN杂志。
用户1279583
2020/07/15
2K0
BRAIN:用于阿尔茨海默病分类的可解释深度学习框架的开发和验证
重度抑郁症患者的脑龄
重度抑郁症(Major depressive disorder, MDD) 与脑萎缩、衰老相关疾病以及死亡事件的风险增加有关。本研究在一个大型多中心国际数据集中,研究了成人MDD患者大脑的提前衰老,以及这一过程是否与临床特征相关。本研究汇集了来自全球19个样本集中T1加权MRI图像的大脑测量数据,进行了一项mega分析。通过测量来自ENIGMA MDD工作组对照组 (952名男性和1236名女性) 的7个皮质下体积、34个皮质厚度和34个表面积、侧脑室和总颅内体积,预测实际年龄 (18–75岁),来评估健康脑龄。将学习到的模型系数应用于927名对照组男性和986名抑郁症男性、1199名对照组女性和1689名抑郁症女性,以获得独立的无偏差脑龄预测值。计算预测“脑龄”和实际年龄之间的差异,来代表预测脑龄差异 (brain-predicted age difference, brain-PAD) 。平均而言,与对照组相比,MDD患者的brain-PAD 高出+1.08岁(SE 0.22) (Cohen's d=0.14, 95%置信区间: 0.08–0.20) 。然而,这种差异似乎不是由特定的临床特征 (复发状态、缓解状态、抗抑郁药物使用、发病年龄或症状严重程度) 驱动的。这项研究显示了MDD患者中与年龄相关的大脑结构异常的微妙模式。观察到大量组内差异和组间重叠。未来,需要对MDD和躯体健康结果进行纵向研究,以进一步评估这些brain-PAD估计值的临床价值。本文发表在 Molecular Psychiatry杂志。
用户1279583
2022/02/28
4590
重度抑郁症患者的脑龄
利用机器学习和功能连接预测认知能力
使用机器学习方法,可以从个体的脑功能连通性中以适度的准确性预测认知表现。然而,到目前为止,预测模型对支持认知的神经生物学过程的洞察有限。为此,特征选择和特征权重估计需要是可靠的,以确保具有高预测效用的重要连接和环路能够可靠地识别出来。我们全面研究了基于健康年轻人静息状态功能连接网络构建的认知性能各种预测模型的特征权重-重测可靠性(n=400)。尽管实现了适度的预测精度(r=0.2-0.4),我们发现所有预测模型的特征权重可靠性普遍较差(ICC<0.3),显著低于性别等显性生物学属性的预测模型(ICC≈0.5)。较大的样本量(n=800)、Haufe变换、非稀疏特征选择/正则化和较小的特征空间略微提高了可靠性(ICC<0.4)。我们阐明了特征权重可靠性和预测精度之间的权衡,并发现单变量统计数据比预测模型的特征权重稍微更可靠。最后,我们表明,交叉验证折叠之间的特征权重度量一致性提供了夸大的特征权重可靠性估计。因此,如果可能的话,我们建议在样本外估计可靠性。我们认为,将焦点从预测准确性重新平衡到模型可靠性,可能有助于用机器学习方法对认知的机械性理解。
悦影科技
2023/07/28
4920
Neuron综述:机器学习在大数据影像研究临床转化中的挑战
深度学习图像分析方法和大规模成像数据集的结合为神经科学成像和流行病学提供了许多机会。然而,尽管深度学习在应用于一系列神经成像任务和领域时取得了这些机会和成功,但大规模数据集和分析工具的影响仍然受到重大障碍的限制。在这里,我们研究了主要的挑战以及已经探索的克服这些挑战的方法。我们将重点讨论与数据可用性、可解释性、评估和后勤挑战相关的问题,并讨论仍然需要解决的问题,以使大数据深度学习方法在研究之外取得成功。
悦影科技
2023/02/05
1.2K0
NeuroImage:基于脑电和结构MRI的AD和轻度认知障碍机器学习分类研究
《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》 1. 背景   阿尔茨海默氏病(AD)是引起痴呆症的主要原因,约占全世界病例的70%。到2050年,痴呆症的发病率将增加两倍,大多数新病例将出现在在中低收入国家。轻度认知障碍(MCI)是健康和痴呆症之间的一个阶段,其特征是认知缺陷但不影响日常生活。MCI患者罹患痴呆症的风险增加,在5年内平均进展率为39%。目前迫切需要低成本,可普及的方法来促进早期痴呆症的发现。脑电图(EEG)由于其低成本和便携性而具有解决这一需求的潜力。近期,发表在《NeuroImage》杂志的一项研究收集了老年AD患者(55岁),健忘性MCI(aMCI)和健康对照组(每组约60名)的静息状态EEG,结构MRI(sMRI)和大量的神经心理学数据,在此基础上评估了AD和aMCI分类的一系列候选EEG标记(即频段功率和功能连接),并将其分类性能与sMRI进行了比较。该研究还测试了脑电图联合认知量表分类模型。在对AD进行分类时,sMRI的表现优于静息状态EEG(AUCs分别为1.00和0.76)。但EEG和sMRI都只能较好地区分aMCI和健康老年人(AUCs=0.67–0.73),而且两种方法均未达到70%以上的灵敏度。相对于单独使用MMSE评分,EEG联合MMSE评分并没有优势。该研究是脑电图和sMRI对AD和aMCI分类的首次直接比较。 2.方法 2.1研究群体   从Dokuz Eylul大学神经病学系的门诊招募了AD(n=118)和aMCI的老年人(n=134)。利用各种社区资源中招募健康的老年人(n=198;55岁及以上),包括在公共会议和大学广告牌上发布公告。AD诊断是根据美国衰老和老年痴呆症协会(NIA-AA)的标准做出的。AD患者的纳入标准是:a)隐匿性发作;b)日常功能受损(临床痴呆评分(CDR)评分为1);c)两个或多个认知领域的损害;d)排除谵妄,痴其他原因引起的呆和其他主要精神疾病等。根据NIA-AA标准进行了aMCI诊断。 2.2诊断标准   所有受试者均通过一系列全面的神经心理学测试进行评估,旨在通过以下测试评估言语和视觉情景记忆、注意力、执行功能、视觉空间技能和语言:MMSE、Oktem口头记忆能力测试(OVMPT)、韦氏记忆量表修订版(WMS-R)数字跨度测试、口语流利性测试(语义)、波士顿命名测试(BNT)和CDR量表。使用了Yesavage老年抑郁量表排除抑郁。最后,所以受试者进行了神经、神经影像和实验室检查。 2.3EEG数据获取    根据国际10-20系统,将30个Ag / AgCl电极放在弹性帽(Easy-Cap;Brain Products GmbH;Gilching,德国)上记录脑电图,连接的耳垂电极(A1+A2)作为参考。记录室是电屏蔽的,声音衰减并且光线昏暗。从右眼的内侧上眼眶边缘和外侧眼眶边缘记录眼电图(EOG)。所有电极阻抗均小于10kΩ。脑电图和EOG通过带有0.03–70 Hz带通滤波器的Brain Amp 32通道DC系统机器进行放大,并以500 Hz的采样率在线数字化(Brain Products GmbH;Gilching,德国)。记录EEG:睁眼(EO)4分钟,闭眼(EC)4分钟。 2.4EEG数据预处理   EEGLAB结合FASTER插件进行预处理。将数据在0.1到70 Hz之间进行带通滤波,在50 Hz处陷波滤波,并以所有头皮电极为参考取平均。然后将其提取为2 s的数据段。FASTER删除了包含大伪迹(例如肌肉抽搐)和信号质量较差的内插通道数据。还使用FASTER自动识别了伪迹(即非神经)独立成分,并将其从数据中自动删除。然后视检数据质量,并去除任何残留的杂乱含噪数据。   去除受额外噪声影响的42例数据(16AD,13aMCI,13HC)。剩余408例数据(102AD, 121aMCI, 185HC)。闭眼状态下,预处理和视检去除数据平均百分数为6.38%(SD=2.78%, median=5.23%,range=2.08-23.03%),睁眼状态为6.67%(SD=5.91%,median=4.85%,range=2.08-26.88%)。闭眼状态,去除的独立成分平均数为2.73(SD=0.92, MEDIAN=3,RANGE=1-5),闭眼脑电最终平均时长225s,(SD=9.89S,MEDIAN=227.46S,RANGE=184.72-235),睁眼脑电为224s,(SD=12.72S,MEDIAN=228.35,RANGE=175.48-235)。 2.5脑电频段和功率比计算   使用具有Hann窗和0.5 Hz频率分辨率的多窗谱估计,对30个头皮电极上的绝对和相对功率进行谱分析。分别计算受试者睁眼和闭眼时脑电的功率,以探索这两种唤醒状态之间的潜在差异。包括以
悦影科技
2020/11/20
7250
NeuroImage:基于脑电和结构MRI的AD和轻度认知障碍机器学习分类研究
Brain:一种用于阿尔兹海默症(AD)分类的可解释的深度学习框架
阿尔茨海默病是全球范围内痴呆症的主要原因,随着人口老龄化,其发病率负担日益加重,可能超过诊断和管理能力。目前的方法综合了病史、神经心理测试和MRI来识别可能的病例,但有效的做法仍然存在差异,缺乏敏感性和特异性。该研究报告了一种可解释的深度学习策略,其以MRI、年龄、性别和精神状态测试分数的多模态信息作为输入,可以描述独特的阿尔茨海默病特征。我们的框架连接了一个全卷积网络,该网络构建了从局部大脑结构到多层感知器的疾病概率的高分辨率地图,并在准确诊断的过程中生成精确、直观的阿尔茨海默病个体风险可视化。该模型使用阿尔茨海默病神经成像倡议(ADNI)数据集(n = 417)中的临床诊断阿尔茨海默病和认知正常受试者进行训练,并在三个独立队列中进行验证:澳大利亚衰老成像、生物标志物和生活方式旗舰研究(AIBL) (n = 382)、弗雷明汉心脏研究(n = 102)和国家阿尔茨海默病协调中心(NACC) (n = 582)。使用多模态输入的模型在不同数据集上表现一致,ADNI研究、AIBL、Framingham心脏研究和NACC数据集的曲线下平均面积分别为0.996、0.974、0.876和0.954。此外,我们的方法超过了由多机构执业神经学家组成的团队(n = 11)的诊断性能,并且该模型预测的高风险大脑区域密切跟踪了死后的组织病理学结果。该框架提供了一种临床适应性策略,可以使用常规可用的成像技术(如MRI)来生成阿尔茨海默病诊断的细微神经成像信号,以及一种可推广的方法,将深度学习与人类疾病的病理生理过程联系起来。
悦影科技
2022/03/02
1.3K0
NC:预测阿尔茨海默病的个体进展轨迹
对阿尔茨海默病(AD)进展的预期对于评估二级预防措施是至关重要的,因其被认为可以改变疾病的发展轨迹。然而,很难预测AD的自然进展,特别是不同的功能在不同的年龄下降,不同患者的发生率不同。我们在这里评估了AD进程映射,这是一个统计模型,根据当前疾病早期阶段的医学和放射学数据,预测患者的神经心理评估和成像生物标志物的进展。我们对96000多例患者进行了该方法的测试,其中包括来自四大洲的4600多名患者。我们测量了方法准确性通过选择了在一个假设的试验中显示临床端点进展的被试。我们发现,使用预测进展者丰富人群可以使所需的样本量减少38%至50%,这取决于试验时间、结果和目标疾病阶段,从无症状的AD风险个体到早期和轻度AD被试。我们表明,该方法没有引入关于性别或地理位置的偏差,并且对缺失的数据是稳健的。它在疾病的早期阶段表现最好,因此非常适合用于预防试验。
悦影科技
2023/06/25
8270
NC:数据泄漏会夸大基于连接的机器学习模型的预测性能
预测建模是神经影像学中识别大脑行为关系并测试其对未见数据的普遍适用性的核心技术。然而,数据泄漏破坏了训练数据和测试数据之间的分离,从而破坏了预测模型的有效性。泄漏总是一种不正确的做法,但在机器学习中仍然普遍存在。了解其对神经影像预测模型的影响可以了解泄露如何影响现有文献。在本文中,我们在4个数据集和3个表型中研究了5种形式的泄漏(包括特征选择、协变量校正和受试者之间的依赖)对基于功能和结构连接组的机器学习模型的影响。通过特征选择和重复受试者产生的泄漏极大地提高了预测性能,而其他形式的泄漏影响很小。此外,小数据集加剧了泄漏的影响。总体而言,我们的结果说明了泄漏的可变影响,并强调了避免数据泄漏对提高预测模型的有效性和可重复性的重要性。
悦影科技
2024/06/14
1970
推荐阅读
相关推荐
脑影像中的深度学习研究:前景与挑战
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档