
心源性猝死在理论上可以通过植入式除颤器预防。然而,每年仍有大量患者在没有植入除颤器的情况下死亡,主要原因是医生未能准确预测其未来风险。目前临床广泛使用的主要预测性生物标志物是左心室射血分数,但它会漏掉大多数心源性猝死病例,同时也会把许多低风险患者标记为需要植入除颤器,导致除颤器从未真正发挥救命作用。
研究人员将深度学习应用于瑞典某地区的大规模数据集,该数据集把所有心电图与死亡证明相连接。由此得到的模型识别出一个高风险群体,占样本的 2.2%,其心源性猝死年发生率达到 7.0%,高于左心室射血分数降低患者群体的 4.6%。值得注意的是,模型识别出的高风险患者中有 86.1% 并未被左心室射血分数标记。已经植入除颤器的高风险心电图患者,其死亡率比预期低 54.4%,提示这一群体可能从除颤器中获益。研究人员进一步在美国医疗系统中进行外部验证,模型能够预测导致猝死的室性心律失常;在台湾医院登记数据中,模型则能够特异性预测未来的心律失常性心脏骤停。为了可视化预测模型“发现”的心电波形形态,研究人员将预测模型与心电波形生成模型结合。两者共同揭示了一种肉眼可见、能够稳健预测心源性猝死、但此前尚未被描述的心电图生物标志物。研究人员还将该标志物的形态与电生理基本原理联系起来,提出并初步检验了关于心源性猝死机制的新假设。

每年,心律失常在全球范围内导致大量突发死亡。自 20 世纪 80 年代以来,植入式心律转复除颤器已经能够检测并终止致命性心律失常,因此许多心源性猝死在原则上可以被预防。然而,除颤器植入本身具有成本和潜在风险,因此临床关键问题不是简单地为所有人植入设备,而是准确识别未来心律失常风险足够高、能够从除颤器中获益的患者。
当前风险预测的核心工具是左心室射血分数。左心室射血分数降低确实提示较高心源性猝死风险,并且在相关患者中,除颤器可以带来明确生存获益。但这一指标存在明显缺陷。一方面,许多最终发生心源性猝死的人在生前并未测量过左心室射血分数;即使测量过,也只有少数人达到“降低”的标准。另一方面,很多因左心室射血分数降低而植入除颤器的患者,其设备后来从未释放救命性电击,意味着这些患者承担了植入成本和并发症风险,却没有真正获得预防性获益。
由于左心室射血分数存在这些局限,许多研究者呼吁寻找新的风险评估方式。但左心室射血分数仍然是临床中最广泛使用的指标,这不仅是因为它有一定预测能力,也因为它具有实际优势:心脏超声检查普及、标准化程度高、全球可用性强。其他检查方式,例如心脏磁共振、长期动态监测、电生理检查、核医学成像和遗传检测,也显示出潜力,但这些检查成本较高,部分具有侵入性或风险,不适合大规模人群筛查。
心电图处于成本光谱的另一端。它便宜、标准化程度高、临床应用极为广泛,长期以来一直被用于寻找猝死风险标志物。然而,传统人工定义的心电图标志物尚未达到足以取代或竞争左心室射血分数的预测能力。此外,人工编码心电图特征需要专业经验,数据采集和解释存在变异,也限制了泛化能力。
深度学习应用于心电图,理论上可以结合两方面优势:心电图本身低成本、广泛可得、标准化,而深度学习模型可以直接读取波形图像或信号,无需人工特征编码即可预测风险。此类模型过去尚未充分发展,一个关键原因是缺乏大规模心电图与可靠死因信息相连接的训练数据。研究人员因此使用瑞典基于人群的数据,将一个地区所有心电波形与死亡证明和电子健康记录相连接,训练深度学习模型预测心源性猝死,并在瑞典保留数据、美国数据和台湾数据中进行验证,同时尝试解释模型发现的心电图形态学标志物。
方法
研究人员首先建立了一个瑞典地区级数据集,将大规模心电图波形与死亡证明、电子健康记录、左心室射血分数和除颤器植入信息相连接。模型的主要训练标签为心电图后一年的院外心源性死亡。为避免分析过程中的信息泄漏,研究人员预先保留了一个 40% 的瑞典数据“锁箱”作为最终检验集,在模型训练和论文初稿分析期间不触碰该数据。模型训练完成后,研究人员在该锁箱中评估模型对心源性猝死的预测能力,并进一步比较模型与左心室射血分数的重叠和差异。研究人员还在瑞典健康记录中用室颤或室速等室性心律失常作为近端机制结局进行验证,在美国 Sharp HealthCare 系统中进行零样本外部验证,并在台湾大学医院急诊心脏骤停登记数据中测试模型对心律失常性心脏骤停的特异性预测能力。为了理解模型发现了什么,研究人员又训练了心电图生成模型,使其从低风险心电图逐步生成同一患者的高风险反事实波形,并据此识别与高风险相关的可见波形变化。最后,研究人员结合除颤器植入数据、回归分析和心脏磁共振线索,初步探索该心电图标志物的临床意义和潜在机制。
结果
瑞典锁箱数据中的预测性能
心源性猝死本身具有诊断上的不确定性。许多患者在院外突然死亡,很难完全确定死亡前发生了什么。因此,研究人员没有只依赖单一定义,而是采用多种与文献一致的结局定义,包括死亡证明、导致猝死的心律失常诊断,以及详细病历审查。
研究人员首先使用最直接的定义评估模型,即心电图后一年的死亡证明显示患者在院外死于心脏原因。主要分析在瑞典 40% 锁箱数据中进行,该数据包含 119,541 份具有一年随访的心电图,来自 35,885 名 80 岁以下患者;其中不含既有除颤器患者的主要分析样本包括 113,072 份心电图,来自 35,417 名患者。锁箱数据在任何分析或模型训练前就被保留,直到论文获得初步接收后才用于最终结果生成。
模型在该锁箱数据中表现出较高区分能力,预测心源性猝死的 AUC 为 0.872。相比之下,通用心血管风险评分和已有 ECG 深度学习心脏病风险模型的 AUC 均较低。更重要的是,临床应用需要模型不仅能排序风险,还能定义一个足够高危、可能值得植入除颤器的离散患者群体。研究人员因此在不同风险百分位阈值下计算高风险组的心源性猝死年发生率。结果显示,风险在最高 10% 附近开始明显上升,最危险的 1.0% 人群具有较高的年猝死率。研究人员最终选择的高风险组占样本的 2.2%,其心源性猝死年发生率为 7.0%,这一风险水平高于历史除颤器随机试验对照组患者的中位风险水平,因此具有潜在临床意义。
研究人员也担心死亡证明可能会把非心律失常性突然死亡误认为心源性猝死,例如卒中或呼吸衰竭等原因。为此,研究人员进一步考察模型是否能预测室颤或室速这些导致猝死的近端心律失常。在瑞典数据中,模型预测风险越高,室颤、室速以及心源性猝死的复合结局发生率越高。除高风险组已有 7.0% 的心源性猝死外,另有 3.8% 的患者在一年内出现室颤或室速。这说明模型并非只是在捕捉死亡证明中的模糊心脏死亡标签,而是与致命性室性心律失常机制相关。

图1:模型预测风险阈值与心源性猝死阳性预测值。
模型在美国和台湾数据中的泛化能力
研究人员接下来测试模型能否泛化到两个外部数据集。需要注意的是,三个地区的数据在结构和结局定义上并不完全相同。瑞典数据同时包含死亡证明和室颤、室速诊断;美国数据主要包含健康记录中的室颤、室速诊断;台湾数据则是医院急诊心脏骤停病例对照登记。这些差异会影响性能指标解释,但也使研究人员能够从不同角度检验模型在不同人群和不同猝死测量策略下的表现。
美国数据来自加州圣迭戈 Sharp HealthCare 医疗系统,包括 2021 年至 2022 年间 139,613 名 80 岁以下患者的 251,858 份心电图。由于美国健康记录与死亡证明连接存在困难,研究人员没有观察死因,但能够从纵向健康记录中观察心电图后一年的室颤或室速发生情况。美国医疗体系对室性心律失常的测量和记录动力更强,因此可能捕获更多实际发生的室颤或室速事件。模型未经微调,直接零样本应用于美国数据,预测室颤或室速的 AUC 达到 0.822,高于其在瑞典数据中预测室颤或室速的表现。在美国数据中,如果将最高风险 2.2% 定义为高风险组,其室颤或室速年发生率达到 29.1%,明显高于总体基线发生率。
第二个外部数据集来自台湾大学医院。研究人员识别了 257 名 80 岁以下急诊心脏骤停患者,并随机抽取了 4,011 名同一急诊就诊的对照患者。研究人员通过急诊和住院病程、急救人员及家属访谈、出院病历审查等详细信息,判定其中 96 例骤停由心律失常导致。对于病例和对照,研究人员均选择急诊就诊前最近一次心电图,然后直接应用模型,不进行微调。模型区分未来心律失常性心脏骤停与对照的零样本 AUC 为 0.767。
台湾数据还允许研究人员进行一个更精确的特异性测试。由于数据中既有心律失常性骤停,也有肺部或神经系统原因导致的非心律失常性骤停,因此可以检验模型是否只是泛化地预测“严重不良事件”,还是特异性预测心律失常性骤停。结果显示,模型区分非心律失常性骤停与对照的表现明显更差,接近随机猜测。这为模型对心律失常性死亡的特异性提供了支持。

图2:高风险组中室性心律失常发生率随风险阈值升高而增加。
高风险患者中的除颤器与死亡率
由于该研究不是随机试验,研究人员无法直接证明除颤器一定能降低模型高风险患者的死亡率。但研究人员可以提供提示性证据:比较已经植入除颤器的高风险患者与风险相似但未植入除颤器的患者。如果植入除颤器的高风险患者死亡率低于预期,这可能提示除颤器存在获益,尽管观察性数据仍可能受到未测量混杂因素影响。
在瑞典数据中,研究人员使用回归模型分析心源性猝死与患者年龄、性别、是否属于高风险 ECG、是否植入除颤器以及“高风险 ECG × 除颤器”交互项之间的关系。核心关注点是交互项,因为它反映了已经植入除颤器的高风险患者,其死亡率是否低于根据高风险状态和除颤器状态本身所预期的水平。结果显示,已经植入除颤器的高风险 ECG 患者,其死亡率显著低于预期。绝对值上,这些患者的死亡率比预期低 3.62 个百分点,相当于 54.4% 的相对降低。
为了检验这种分析框架是否具有表面合理性,研究人员在左心室射血分数降低患者中重复同样分析,因为这一群体的除颤器获益已经在随机试验中得到证实。结果显示,左心室射血分数降低且植入除颤器的患者同样表现出低于预期的心源性猝死率,幅度与既往试验结果处于相近范围。这增加了研究人员对分析框架的信心。
研究人员还考察了全因死亡率。结果显示,在模型识别的高风险 ECG 患者中,除颤器不仅与心源性猝死减少相关,也与全因死亡率降低相关。相比之下,左心室射血分数降低患者中,除颤器与全因死亡率降低的关系并不显著。虽然这些结果不能直接推广到所有模型高风险患者,因为它们基于当前临床实践中已经被选择植入除颤器的人群,但它们支持进一步开展随机试验来验证模型识别患者是否真正能从除颤器中获益。
ECG 模型与左心室射血分数的比较
ECG 模型与左心室射血分数有一些相似的实际优势。二者都来自常见、标准化、容易获得的医学检查,也都可以识别可能从除颤器中获益的心源性猝死高风险患者。因此,一个关键问题是:ECG 模型是否只是重新发现了那些已经被左心室射血分数降低标记的患者,还是发现了新的、此前未被怀疑的高风险人群?
研究人员在瑞典锁箱数据中分析了三类人群的重叠:测量过左心室射血分数的人群、左心室射血分数降低的人群,以及 ECG 模型识别出的高风险人群。结果显示,模型高风险 ECG 人群中只有 13.9% 已知具有左心室射血分数降低。这说明模型识别出大量新的高风险患者,而不是简单复制已有临床指标。
总体上,ECG 模型高风险组的心源性猝死发生率高于左心室射血分数降低组。如果将 ECG 高风险组大小调整到与左心室射血分数降低组相同,ECG 高风险组仍然具有更高猝死率。当两个指标同时认为患者高风险时,心源性猝死率最高,提示左心室射血分数仍然提供独立风险信息。但更重要的是,在左心室射血分数正常或未知的患者中,ECG 模型仍能识别出猝死风险高于左心室射血分数降低患者的亚群。尤其是在已经测量且左心室射血分数正常的人群中,目前临床缺乏有效风险预测手段,而该模型可以填补这一空白。

图3:ECG 高风险组与左心室射血分数降低组的重叠关系。
模型发现的 ECG 生物标志物
过去一百年中,许多心血管发现都始于一种相关性:医生在具有突出临床结局的患者心电图上观察到特殊波形,然后在更大样本中验证这种相关性,并进一步从电生理原理出发探索其机制。布鲁加达综合征、心肌梗死相关波形和预激综合征等发现,都遵循过类似路径。
然而,人类观察相关性容易出错。有些相关性是偶然的,有些则会因为视觉或计算能力限制而被忽略。机器学习可以避免部分限制,因为它能够在高维心电信号中稳健识别与猝死相关的模式。但深度学习模型也有解释困难:常规可解释性方法通常只能显示模型“看哪里”,却不能说明模型“看到了什么”。人类也很难简单地把高风险和低风险心电图放在一起比较来逆向推断模型,因为心电图是复杂的高维信号,不同患者之间存在大量与风险无关的变化。
为了解决这一问题,研究人员把解释任务设计成预测模型与生成模型之间的对话。预测模型可以给任意心电波形赋予风险分数,生成模型则可以生成任意心电波形。研究人员让预测模型的风险反馈引导生成模型,使其从一个真实低风险患者的心电图出发,逐步生成同一患者的高风险反事实心电图。这样可以在尽量保持患者其他特征不变的情况下,突出模型所识别的风险信号。
生成结果显示,高风险反事实心电图出现了电轴偏移,即心脏去极化平均电向量发生旋转。在额面上,可见左轴偏移,表现为 I 导联和 aVL 导联振幅更高、III 导联振幅更低,符合左前上分支阻滞的特征。在轴面上,可见后向旋转或 R 波进展不良。这些形态学特征是已知缺血性心脏病相关表现,因此模型将其与心源性猝死联系起来并不令人意外。
更有趣的是,生成模型在 aVL 导联的高风险 QRS 波群中揭示出一种此前未被描述的形态。具体而言,R 波末端部分变得钝挫或模糊,取代了低风险波形中清晰、尖锐的负向 S 波。显著性图也提示该区域对模型预测有重要贡献,但显著性图本身无法进一步解释其含义。研究人员随后量化这一形态,使用 QRS 波群从 R 峰到 QRS 结束阶段的振幅变化特征作为指标。结果显示,这些新特征在瑞典和美国数据中均能显著预测心源性猝死;在台湾数据中方向一致但不显著,可能与样本量较小有关。
研究人员还将这些新特征与已知的左轴偏移进行比较,发现新特征能够提供独立预测信息,效应量与左轴偏移相近。进一步的单导联模型分析显示,多个单导联模型的预测 AUC 接近 12 导联模型,尽管阳性预测值较低。这提示模型捕捉到的可能不是局限于某个单一视角的局部异常,而是弥散存在于心肌中的过程。

图4:低风险与高风险 ECG 波形反事实变形。

图5:高风险患者 ECG 中识别出的新型 aVL 导联生物标志物。
临床与科学意义
研究人员认为,该研究提示了两个方向的未来工作,一个偏向临床实践,一个偏向基础机制。临床上,模型识别出的高风险患者可能代表一个此前未被发现的新群体,他们具有频繁且可能可预防的死亡风险。这样的风险可以通过门诊心脏监测进一步确认。随着除颤器技术进步,例如皮下除颤器和可穿戴贴片式设备,将除颤器应用于新的高风险群体变得更有吸引力。然而,研究人员强调,真正关键的是在高风险患者中开展随机试验,因为过去许多看似有前景的预测指标最终未能可靠识别从除颤器获益的患者。
科学上,该方法为研究心源性猝死机制提供了新的入口。计算心脏模型正在越来越精细地模拟电生理过程如何生成体表心电波形。如果能将本文的生成模型与这些电生理计算模型连接起来,就可能把高风险心电图形态追溯到具体机制,从而提出新的诊断或治疗靶点。更重要的是,模型可以在患者死亡前识别高风险人群,使研究人员能够前瞻性地收集这些患者的症状、心血管和遗传风险因素、心脏结构以及电生理功能信息。以往许多猝死研究只能在死亡后回顾性开展,而心脏功能状态无法在死后完整研究,因此前瞻性识别高风险患者具有重要价值。
研究人员还提出了一个初步机制假设。高风险患者 QRS 波群末端下降支变钝,可能说明随着去极化过程推进,心脏电向量相对于导联方向逐渐变得更正交或更无序。这可能来自一种逐渐累积的传导障碍过程。研究人员用一个高度简化的心肌细胞片层思想实验来理解这一现象:如果心肌中随机分布着传导障碍,去极化波前会不断分裂和散射,使平均电向量在时间推进中越来越偏离初始方向。aVL 导联之所以更清楚地显示这一变化,可能是因为它的轴向与高风险患者的左向旋转电轴更一致,也可能因为其正电极位置更接近心脏基底部,更适合捕捉去极化末端的异常。
为了寻找可能产生弥散性传导障碍的物理基础,研究人员回顾了验证集中少数患者的心脏磁共振影像。盲法审查显示,预测风险最高 10% 的患者更常见左心室内弥散、细微的晚期钆增强。这种模式通常与心肌纤维化有关,即电惰性胶原组织沉积在心肌细胞之间。纤维化能够改变传导,是连接 ECG 标志物与心源性猝死的一种可能机制。它也可能解释高风险患者中的左轴偏移,因为弥散性纤维化可能首先影响较薄、更脆弱的左前分支,导致左前分支阻滞和左轴偏移。
研究人员强调,这一机制解释仍具有推测性。心肌纤维化并不是首次被认为可能导致心源性猝死,但它很难研究,因为心内膜心肌活检才是确诊手段,而心脏磁共振对弥散、细微纤维化可能存在假阴性。因此,临床医生和研究者可能低估其重要性。未来,将心电图标志物与心肌活检、心脏磁共振和电生理检查结合,可能有助于识别更广泛的病理生理因素。
讨论
研究人员的核心发现是,深度学习可以从常规心电图中识别一个此前临床未充分认识的心源性猝死高风险群体。这个群体的风险水平高于左心室射血分数降低患者,而且大多数并不会被左心室射血分数标记。模型不仅在瑞典人群数据中表现良好,也能在美国健康系统和台湾医院病例登记数据中泛化,并且对室性心律失常和心律失常性骤停具有较强特异性。
从临床角度看,该模型具有较高可用性,因为心电图便宜、标准化、普及率高,适合大规模筛查。它可以补充甚至部分超越左心室射血分数,特别是在左心室射血分数正常或未测量的人群中识别新高风险患者。观察性分析还提示,模型高风险患者可能从除颤器中获得死亡率降低,但这一点必须通过前瞻性随机试验验证。
从科学角度看,该研究的意义不仅在于预测,还在于发现。研究人员通过生成模型把深度学习预测信号转化为可见波形,识别出 aVL 导联 QRS 末端钝挫这一新型 ECG 生物标志物。该标志物可能与弥散性传导障碍和心肌纤维化有关,为解释心源性猝死机制提供了新的假说。总体而言,这项研究表明,深度学习不仅可以帮助医生预测谁处于高风险,也可以帮助研究人员发现隐藏在常规临床信号中的新生物学线索。
整理 | DrugOne团队
参考资料
Obermeyer, Z., Schubert, A., Ross, J. et al. An ECG biomarker for sudden cardiac death discovered with deep learning. Nature (2026).
https://doi.org/10.1038/s41586-026-10674-6
