想象一下未来,有人向具有数据资源的一位临床医生寻求医疗服务,医生所具有的数据不仅包括她的病史,还有她的基因序列和活动追踪信息,以及关于她的居住数据、水、空气质量和她的社交网络数据。根据这些数据,临床医生在出现任何症状之前就会知道她有哪些疾病的风险,甚至知道如果出现疾病,哪种药物最有效。这种情况,对某些人来说,是赋能;对另外一些人来说,是恐惧。然而,这是精准医疗的理想,这是一种新兴的方法,旨在利用日益增长的医疗健康数据,为个人提供更好的保健,并提高整个医疗保健行业的效率。
这种未来精准医学的梦想与当今世界医疗保健的现实形成了鲜明对比。世界范围内,在医疗保健上花的钱很多,但却没有带来好的健康结果。此外,不同人群之间的健康差异也是惊人的。
获取数据,特别是大量和多样的医疗保健数据,可以帮助医务人员进行干预,并开始解决我们遇到的一些医疗保健问题。医疗记录的快速数字化以及计算和数据分析技术的进步,意味着除了遗传学之外,还可以挖掘其它类型的数据,以洞察健康和疾病。多年来,利用新的数据和信息处理方式来发展更好的医学一直是医学研究的重要推动力。例如,科学家们希望,在人类基因组计划中对整个基因组进行测序不仅能促进分子生物学的发展,还能应用于医学,从而对健康产生令人兴奋的、前所未有的见解。虽然我们可以从遗传学研究中追溯精准医学的血缘宗谱,但这个故事的另一个重要方面就是增加对疾病的其它非遗传因素的科学兴趣和研究。例如,表观遗传学是一个新兴领域,它试图了解非遗传因素(如孕产妇营养)如何导致生理变化和疾病风险。随着企业、学术机构和政府在精准医学研究和治疗项目上的大量投资,美国和世界各地都对精准医学产生了浓厚的兴趣。
精准医疗可定义为收集、整合和分析多个数据源,以形成关于健康和疾病的个性化见解的努力。精准医学获取的是传统上公认的医学数据,如检查检验结果、基因数据等,以及其他非医学数据,如空气和居住质量指标。对精准医学的这些看法,以及对这一领域研究的关注,与罗斯坦所说的“大数据健康研究”是一致的。“我们选择关注多种形式的数据,因为收集和合并来自不同领域的数据会带来许多独特的机遇和挑战。”
精准医疗的这一定义也让我们认识到,其他领域的大数据所带来的挑战,在生物医学研究乃至最终的医疗实践中,究竟会不会发挥作用。尽管被称为“大数据”,但“大数据”并不重要,因为现在计算机可以收集和分析的数据量很大。正如博伊德和克劳福德所指出的,大数据之所以重要,是因为“大数据的价值来自于通过将个人的数据、个人与他人的关系、群体的数据,或者仅仅是关于信息本身结构的这些碎片数据间建立起联系而得出的范式。”精准医学研究的关键在于大数据分析揭示各种关系的能力,这些关系能够提供疾病的各种成因的洞见。因此,将医疗健康数据进行分析以显示不同变量之间的关系的概念,对于理解精准医学在研究领域的发展是至关重要的。这也是为什么精确医学可以被理解为一个新的和新兴的领域,尽管科学家和临床医生使用生物和非生物信息来定制治疗和护理已经有着悠久的历史。
在美国,有许多大规模的精准医学研究项目才刚刚开始。目前的工作主要集中在收集数据上。这一领域的项目包括美国国立卫生研究院(NIH)的“我们的大家研究计划”(All UsResearch Program),该计划旨在收集美国100万名志愿者的数据;美国心脏协会的“我的研究遗产”项目和Alphabet公司的基线研究都是渴望创建一个人类数据“图集”;纽约大学的人类项目将收集数以万计的纽约人的遗传、医疗保健、经济和其它类型的数据。这些研究旨在利用日益获得的种类繁多、数量巨大的数字化医疗保健数据如基因序列、电子病历数据、处方记录,以及来自数字医疗设备和追踪设备的数据。
利用多个数据源以及计算和数据存储方面的进展为个人量身定制医疗服务的目标,可以理解为日益强调解释或应用生物医学研究以解决现实问题的一部分。精准医学的核心是致力于改善健康和福祉的积极努力,而不是限制或削弱健康。
由于精准医学充满了仁爱和善意,因此,研究人员、技术人员、政府决策者和患者权益倡导者更应该注意,这个新兴领域是否可能在提供医疗定制化服务的过程中无意中引入偏见。必须了解收集和分析医疗保健数据可能产生歧视性影响的方式,以及评估这些潜在风险成为实际危害的可能性。
医疗保健数据以多种方式受到偏差的影响,目前可用数据的数量和类型不断增加,这使得很难确定偏差可能出现在何处。在一个研究可在临床上作为指南和为治疗提供信息的生态系统中,偏见可能会有致命的影响。在精准医学中有两种主要的偏差类型:1、在数据集的建立和分析中存在偏差;2、精准医学研究的结果存在偏差。
1、数据集的偏差:数据集可能由于(1)缺乏队列多样性,(2)数据收集和清洗的技术流程,(3)电子病历数据的具体整合而产生无意的偏差。
2、结果的偏差:精确医学研究的结果在许多方面可能具有歧视性。这些因素包括:(1)过于注重个人对健康的责任;(2)那些健康素养较低或资源较少的人群被边缘化;(3)改变公认的生物医学研究形式有可能产生的偏差。
实现精准医疗的愿景仍然面临许多挑战。需要进行研究,以全面了解各种障碍,并确保医疗保健的结构性决定因素得到承认并用于规划干预措施,而不是仅仅将责任归咎于个人。需要制定政策和规章制度,以确保所获得的见解今后不会被用于监测和边缘化脆弱人群。最重要的是,患者和公众需要参与到这一努力中来,既要确保其成功,也要让其他参与者为何时使用以及如何使用数据方面可能出现的误用或误解负责。
★
每日鲜鸡汤★
The greatest danger for most of us is not that our aim is too high and we miss it, but that it is too low and we reach it. 对我们大多数人来说,最大的危险不是我们的目标太高而我们没能达到,而是目标太低而我们达到了它。早上好!