
在低收入和中等收入国家,医疗系统长期面临一个核心难题:如何在资源有限、数据缺失严重的条件下,更高效且更公平地分配基本药物。传统的数据驱动方法往往依赖高质量历史数据,因此难以直接应用于这些资源受限环境。该研究提出了一种“决策感知机器学习(decision-aware machine learning)”框架,用于优化基本药物分配,并结合多任务学习与催化先验(catalytic priors),在有限样本和不完整数据条件下实现更稳定、更公平的需求预测。研究人员与塞拉利昂政府合作,将该系统作为全国性的药物分配决策支持工具进行部署,并通过随机试点和经济计量学评估验证其效果。结果显示,在接受系统干预的地区,药物消费量提升约19%,意味着患者获得基本药物的机会显著增加。随后,该系统被推广至全国范围,覆盖约200万名妇女和5岁以下儿童。研究表明,即使在基础设施受限的全球卫生场景中,低成本机器学习方法依然能够显著提升医疗资源配置效率。

机器学习近年来在医疗领域取得了巨大成功,例如疾病筛查、医学影像分析、电子病历自动生成以及公共卫生监测等。然而,这些成功案例大多发生在高收入国家,因为高质量数据是训练复杂模型的重要前提。相比之下,发展中国家的医疗系统普遍存在供应链管理薄弱、库存记录不完整以及物流基础设施落后等问题,导致机器学习难以直接落地。
塞拉利昂是全球孕产妇死亡率最高的国家之一。为了改善医疗可及性,政府在2010年启动“免费医疗计划(Free Health Care Initiative, FHCI)”,向孕妇和5岁以下儿童免费提供医疗服务和基本药物。然而,这些药物通常每季度才配送一次,因此经常出现某些地区药物过剩、另一些地区严重短缺的情况。此前,国家医疗供应机构(NMSA)主要依赖Excel工具进行药品分配,但这种方法难以捕捉季节性疾病、突发疫情以及区域需求变化等复杂动态模式,因此地方药剂师往往需要大量人工调整。根据官方统计,大约42%的医疗机构需求无法得到满足。
与此同时,虽然一些国际组织尝试通过数字化供应链系统提升药物管理效率,例如受到可口可乐供应链启发的Project Last Mile项目,但由于基础设施与管理体系限制,其推广速度非常缓慢。研究人员因此提出,或许可以通过更加精准的需求预测与优化分配策略,在不显著增加成本的前提下,提高有限药品的利用效率。

图1:决策感知机器学习驱动的基本药物分配系统总体流程图。
方法
研究人员构建了一套完整的“预测—优化”系统。系统首先从塞拉利昂国家数据库DHIS2中提取各医疗机构的月度药物消耗数据,同时从mSupply仓储系统中获取中央库存总量与药品过期时间等信息。随后,系统对数据进行预处理,包括缺失值处理、异常值清洗以及特征工程构建。
在预测阶段,研究人员提出了一种结合多任务学习、催化先验与决策感知学习的新型机器学习框架。多任务学习通过共享不同医疗机构之间的信息,提高小样本环境下的预测能力;催化先验则利用人口统计数据和卫星遥感数据估计医疗机构覆盖人口,从而在数据缺失严重地区提供更加稳健的需求估计;决策感知学习则进一步将最终药物分配目标纳入模型训练,使模型更加关注那些真正影响资源配置结果的预测误差。
在优化阶段,系统根据预测得到的需求分布,通过随机优化算法直接生成面向具体医疗机构的药物分配方案,其目标是最小化“未满足需求(unmet demand)”。此外,系统还会综合仓储位置、运输距离以及药物有效期等因素,自动生成仓库拣货与配送计划。整个流程每季度自动运行一次,并利用新增数据持续更新模型。
结果
系统显著提升了基本药物获取率
研究人员于2023年第二季度在塞拉利昂16个行政区中的5个区率先部署该系统,其余11个区作为对照组。通过Synthetic Difference-in-Differences(SynthDiD)分析,研究发现接受系统干预地区的药物消费量提升了19%,且具有统计学显著性。这意味着更多患者真正获得了需要的药物,从而降低了因药物短缺导致的未满足需求。
进一步的时间序列分析显示,在系统部署之前,实验组与对照组的药物消费趋势基本一致,而部署后实验组消费量明显上升,说明提升并非由自然波动导致,而是来源于该机器学习系统本身。

图2:塞拉利昂试点地区分布图。
大型医疗机构获益更加明显
研究人员进一步分析不同类型医疗机构的受益情况。结果发现,大型医疗机构(例如医院)药物消费量提升幅度达到36%,远高于小型基层医疗点。研究人员认为,大型机构通常拥有更稳定的医疗服务能力,因此更容易将新增药物转化为实际医疗服务。相比之下,一些小型基层机构可能还面临设备不足、人员短缺甚至临时停诊等更深层次问题,因此即便药品供应增加,也难以完全转化为医疗服务能力。
系统提升了资源分配公平性
研究人员特别关注系统是否会加剧“数据富裕地区”和“数据贫困地区”之间的不平等。结果显示,过去经常发生断货的“历史欠服务医疗机构”药物消费量提升了32%,并且具有更高统计显著性。这说明催化先验与公平性约束成功缓解了数据缺失带来的偏差,使资源更加公平地流向真正缺乏药物的地区。
此外,农村医疗机构同样获得了明显收益,并未因为城市机构拥有更多数据而被边缘化。这意味着系统在提高整体效率的同时,也兼顾了公平性目标。
多种鲁棒性分析验证结果可靠
研究人员使用多种不同统计方法对结果进行了验证,包括标准Difference-in-Differences分析、地理匹配分析以及基于替代产品的对照分析。不同方法均得到相近结果,药物消费提升幅度维持在18%–21%之间,说明研究结果具有较强稳定性。
研究人员还针对缺失数据问题进行了多种插值实验,包括低秩矩阵补全、基于人口的方法以及历史均值插值。即使在不同缺失值处理策略下,系统依旧保持显著正向效果。
此外,研究人员还分析了药物断货(stock out)情况。虽然系统总体上减少了断货发生,但统计学上未达到显著性。这一结果实际上符合研究目标,因为系统优化的是整体未满足需求,而非简单减少断货次数。

图3:系统部署前后药物消费趋势与统计评估结果。
讨论
该研究展示了机器学习在资源受限医疗系统中的巨大现实价值。与传统预测模型不同,研究人员提出的决策感知学习框架并不仅仅追求“预测更准确”,而是直接围绕最终资源分配目标进行优化。这种思路使模型能够更加关注真正影响医疗资源配置效果的关键预测误差,从而在有限数据条件下实现更高效率。
研究还强调了系统的极低成本与可扩展性。整个国家级系统每月服务器费用仅约30美元,且无需额外增加工作人员。由于非洲绝大多数国家已经使用DHIS2等数字卫生平台,因此该框架理论上可以较容易迁移至其他国家,仅需根据当地数据结构和政策目标进行适配。
更重要的是,该研究为“AI for Global Health”提供了一个重要范例。过去,医疗AI往往聚焦于影像诊断或大型医院应用,而该工作证明,即使在数据稀缺、基础设施不足的发展中国家,机器学习依然能够以极低成本带来真实且可量化的公共卫生收益。这意味着未来AI不仅可以辅助疾病诊断,也可能成为全球医疗资源调度与公共卫生治理的重要基础设施。
整理 | DrugOne团队
参考资料
Chung, A.TH., Abdulai, J., Bayoh, P. et al. Improving access to essential medicines via decision-aware machine learning. Nature (2026).
https://doi.org/10.1038/s41586-026-10433-7
