审稿 | 李芬 作者 | 赖乐珊
今天给大家介绍的文章来自美国基因泰克公司“Deep learning prediction of patient response time course from early data via neural-pharmacokinetic/pharmacodynamic modelling”,基于神经药代动力学/药效学建模的深度学习从早期数据预测患者的反应时间过程。目前,使用药代动力学或药效学 (PK/PD)方法对给药后的患者反应时间进行纵向分析,仍需要大量的人类经验和相关的专业知识。本文提出了一种新的PK/PD神经网络框架,将药理学原理与常微分方程(ODE)相结合,可以模拟患者对未经测试的给药方案的反应。分析了600多名患者组成的临床数据集的药物浓度和血小板反应,实验证明了该模型自动预测分析患者的反应时间过程的潜力。
给药后患者反应时间过程的纵向分析是药物开发和个体化用药的重要课题。然而,由于患者对治疗反应的多变性和药物机制的复杂性而使得此课题极具挑战性。药代动力学/药效学(PK/PD)学科,能够更好地表征给药、药物浓度和患者反应之间的动力学。利用数学模型将系统药物浓度动力学(即PK)与随时间产生的药理效应(即PD)联系起来。PK/PD模型通常使用常微分方程(ODE)来开发,常微分方程的构建依赖于建模人员将数据抽象为动力系统。这种进行时间预测的模型的准确性取决于建模者用数学公式描述复杂数据集的能力。
曲妥珠单抗恩坦辛(T-DM1)治疗,是一种被批准的抗癌疗法(每三周静脉注射一次3.6mg/kg[Q3W]),用于治疗先前用曲妥珠单抗和紫杉烷治疗失败的人表皮生长因子受体2(HER2)阳性转移性乳腺癌患者。血小板减少是T-DM1的剂量限制毒性,从而需要减少和延迟剂量给药。
神经常微分方程(Neural-ODE)方法非常适合时间序列分析,特别是在PK/PD设置中,因为剂量和测量时间都可能是不规则的。但是目前还没有能够同时清晰表示治疗药物的剂量及其浓度数据的模型。
所以本文提出了一种新的深度学习方法来建立PK/PD模型,该模型直接从数据中学习控制方程,目的是预测患者的反应时间进程,并能够模拟看不见的剂量方案的效果。有两个创新点:
1、该模型的体系结构保留了剂量-浓度-效应的药理学原理,即该模型假设剂量驱动药物浓度的因果关系,进而驱动效应动力学。
2、网络体系结构的构建方式使得药剂数据通过两个端口进入模型,从而确保该模型不仅能够预测现有的治疗数据,而且能够模拟情景,从而修改患者的给药方案。
模型概述
作者通过对以下标准PK/PD假设进行编码,将PK/PD的基本原理合并到文中的neural-PK/PD体系结构中(图1):(1)PK的动态由给药驱动而与PD无关;(2)PD的动态既受PK的驱动,又由其自身驱动。本文通过图1(a)中所示的ODE子模块的“剂量”输入的清晰表示,以及图1(c)和(d)中所示的PK和PD矢量场的依赖,将上述假设构建到模型的计算图中。
图1.neural-PK/PD模型和矢量场(VF)子模块的示意图
概括PK(药物浓度)数据
本文里网络的PK和PD部分是以顺序的方式构建的,以原始pop-PK/PD模型为基准。作者采用先前为T-DM1建立的POP-PK模型,并通过读取先前的PK数据来训练neural-PK模型,并预测未来的时间点。本文使用了665名患者的T-DM1治疗数据集,平均观察和剂量记录时间为169天。
将可用的患者总数分成一个训练集和测试集。如图2所示,训练好的neural-PK模型可以有效地预测(在未见过的测试患者上)T-DM1药物浓度的pop-PK模型的完整时间过程,以21天为一个周期。
从得到的PK观察可以看出,neural-PK模型预测的药物浓度与原pop-PK模型预测的药物浓度具有较好的一致性。
图2 neural-PK模型预测完整PK曲线的能力
概括PD(药物反应)的定性动力学
使用训练好的neural-PK子模块来驱动neural-PD子模块,训练该模块从而生成一个动态系统,该系统概括了观察到的患者血小板轨迹。图3显示了neural-PK/PD模型和pop-PK/PD模型的血小板的预测比较,数据是从测试集中随机选择的示例患者的血小板。结果表明,通过将PK/PD原则融入到其网络体系结构中,所提出的方法能够生成与最先进的模型相当的定性动态行为的PK/PD模型。
.
图3 pop-PK/PD模型和neural-PK/PD模型预测血小板的比较(t<21天的数据是观察的)
Neural-PK/PD模型优于当前的“黄金标准”
将本文的neural-PK/PD模型与当前的“黄金标准”pop-PK/PD模型进行比较。图4表明neural-PK/PD模型使用预测性能的r2和RMSE度量都超过了前者。如表1(情况(A)至(C))所示,对于所有观察时间 (21、42和63天),neural-PK/PD的性能远远超过POP-PK/PD。
图4 pop-PK/PD和neural-PK/PD模型的预测与实际情况的比较
表1 pop-PK/PD与neural-PK/PD预测性能的比较
模拟可供选择的给药方案
pop-PK/PD模型的一个关键用途是对感兴趣的新的给药方案进行模拟,并预测相应的药物浓度和患者对这些未经测试方案的反应。通过设计,给药作为一个独立的输入进入neural-PK/PD模型,从而确保可以根据需要评估不同的给药计划。图5中所示的模拟结果显示,与Q1W(once every week)给药相比,Q3W(once every 3 week)给药中血小板计数的峰谷摆动更大,但具有相当的最低值,与pop-PK/PD模拟结果一致。此外,尽管训练集中没有任何使用Q3D(once every 3 day)给药的患者,该模型仍能够生成预期的PK量变化图。
图5 Neural-PK/PD使用(n=532)训练患者进行群体模拟
患者血液中测得的血小板计数对应于PD变量,本文探究了其时间过程与PK(或药物浓度)的关系。本文比较了neural-PK/PD模型和pop-PK/PD模型用早期数据预测未来血小板计数的能力。数据中80%的患者作为训练集,20%作为测试集。
数据
包括665名接受T-DM1治疗的患者的纵向血小板反应。
神经网络的数据处理
通过从训练集获取完整的时间过程来执行数据归一化,并计算归一化因子;随后,应用相同的比例因子来变换测试集。
为了防止过度拟合,对训练患者集合执行了数据增强,以使神经网络能够基于早期观察数据以及完整给药记录预测未来时间。
Neural-PK模型和训练
Neural-PK模型用来再现pop-PK模型预测的T-DM1浓度时程。
Neural-PD网络和训练
训练好Neural -PK网络之后,通过图1所示的“PDData”子模块为(1)剂量后时间、(2)时间、(3)PK和(4)血小板计数选择进入网络端口“PKPDData”的输入数据。隐含的假设是药物浓度驱动药效学效应,但剂量不直接介导药效学效应。然后,所选数据列被馈送“PDEncode”。最后,“PKEncode和“PDEncode”的输出都被馈送到“ODE”子模块,该子模块使用这些编码向量来模拟模型的PK和PD分量,由图1所示的“Dose”网络端口输入的剂量驱动。
模型预测基准
确保在R2和RMSE方面,pop-PK/PD和Neural-PK/PD都以相同的方式与测试患者的基础血小板数据进行比较。
模拟给药方案
训练组中大多数患者给予Q3W剂量,少数患者给予Q1W剂量。然而,本文可以使用Neural-PK/PD模型来模拟所有患者都接受T-DM1 3.6 mg/kg Q3W剂量的情况。
本文介绍了一种构建neural-PK模型和neural-PK/PD模型的顺序方法。作者展示了该方法在使用曲妥珠单抗恩坦辛(T-DM1)治疗后,对人体内药物浓度和血小板动力学的描述和预测;并通过模拟预测交替(和未测试)给药方案的效果来说明了neural-PK/PD预测的普适性。由此我们期望neural-PK/PD模型的开发和部署可以促进临床药物的开发,并推动个性化药物在临床实践中的应用。
参考资料
Lu, J., Bender, B., Jin, J. Y. & Guan, Y. Deep learning prediction of patient response time course from early data via neural-pharmacokinetic/pharmacodynamic modelling. Nat. Mach. Intell. 25–30 (2021)
doi:10.1038/s42256-021-00357-4.
https://www.nature.com/articles/s42256-021-00357-4
代码
https://www.wolfram.com/player/