在美国,大约12%的女性会在一生中患上侵袭性乳腺癌,预计仅到2020年,就有26.8万例新病例会被诊断出来。幸运的是,根据美国癌症协会的数据,5年平均生存率相当高,为85-99%,而10年平均生存率可以达到83%。但和往常一样,早期检测是造成差异的因素。
在本月发表在《Radiology》杂志上的一篇论文中,位于以色列海法的IBM Research科学家详细描述了一个人工智能模型,它能够预测患者一年内恶性乳腺癌的发展。同行评审的结果表明,他们的系统正确预测了癌症和良性病例的发展分别为87%和77%。此外,它还接受了包含9611张乳房X光片和健康记录的新数据库的训练,能够在48%的人身上识别出乳腺癌,而其他人则不会被标记出来,其准确度与放射科医生相当。
海法团队的工作建立在IBM苏黎世办事处和苏黎世大学科学家进行的一项研究的基础上,该研究构建了一个系统,可以检测和分类肿瘤与免疫细胞以及它们之间的关系。谷歌、麻省理工学院和纽约大学也在努力提高乳腺癌筛查的准确性。
“有一天,我们的模型可以帮助放射科医生确认或否认乳腺癌阳性病例,”IBM研究员兼论文合著者Michal Chorev在一篇博客文章中写道。“尽管假阳性会造成巨大的压力和焦虑,但假阴性往往会妨碍癌症的早期发现和随后的治疗。”
为了编辑一套训练数据集,Chorev和同事们收集了与患者电子健康记录相关的临床数据和生物标志物相关的已识别乳腺造影图像,包括(但不限于)甲状腺功能、生殖史、白细胞概况、代谢综合征和其他信息。他们把这些数据——也包括活组织检查的随访、癌症登记数据、实验室结果以及各种其他程序和诊断的代码——输入到一个机器学习模型中,该模型映射了临床危险因素之间的联系,以预测活组织恶性肿瘤,并区分正常和异常筛查检查。
当涉及到乳房X光扫描时,研究小组主要使用了来自以色列医疗服务提供商Maccabi Health Services和Assuta Medical Center的头盖骨(CC)和中外侧斜位(MLO)的两种乳房X光检查标准视图,这两种视图经常在评估病变时进行比较。最后,他们的数据集包含了52936张来自13234名女性的图像,这些女性在2013至2017年间至少接受了一次乳房X光检查,并且在乳房X光检查之前至少有一年的健康记录。
一种人工智能算法,针对每个预测任务对乳房X光片进行训练,并提取这些任务以及每个视图的成像任务的概率。最后,他们将成像特征以及整个临床特征集合连接到一个单一的患者乳房的表示中。使用单独的人工智能模型估计癌活检阳性或正常/异常分化的最终概率。
下面我们来看看这个人工智能模型的运作流程。
一、包含52936张图像的数据集
为了编制数据集,Chorev和他的同事采集了乳腺摄影图像,这个图像与临床数据、关于患者电子健康记录的生物标志物相关。这个图像包括(但不限于)甲状腺功能、生殖史、白细胞概况、代谢综合征和其他信息。
这些数据来自活组织检查的随访、癌症登记数据、实验室结果以及其他各种程序和诊断的代码。他们将这些数据输入一个机器学习模型,该模型绘制了临床风险因素之间的联系图,以预测活检结果,并区分正常和异常的筛选检查。
他们的数据集包含了来自13234名妇女的52936张图像,这些妇女在2013年至2017年间接受了至少一次乳房X光检查,并且在乳房X光检查之前至少有一年的健康记录。
二、用AI评估乳腺肿瘤异常分化概率
一个人工智能算法在乳房X光片上为每个预测任务训练,并提取这些任务以及每个视图任务的概率。
最后,他们将成像特征和整个临床特征的集合连接到一个患者的乳房表现图中。使用单独的人工智能模型估计肿瘤活检阳性或正常/异常分化的最终概率。
研究人员说,他们的系统推测出可能导致风险升高的临床因素,但在之前的研究中没有使用,如白细胞概况和甲状腺功能测试。“我们计划继续分析这些临床风险因素,以更好地了解它们对个人个性化风险的影响和联系,”Chorev补充道。
领取专属 10元无门槛券
私享最新 技术干货