Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >NEJM | 将偏倚数据视为AI辅助医疗中的信息产物

NEJM | 将偏倚数据视为AI辅助医疗中的信息产物

作者头像
DrugAI
发布于 2023-10-08 07:41:44
发布于 2023-10-08 07:41:44
2540
举报
文章被收录于专栏:DrugAIDrugAI

编译 | 曾全晨 审稿 | 王建民

今天为大家介绍的是来自Kadija Ferryman的一篇论文。在医学领域使用的人工智能(AI)工具,就像在其他领域使用的AI一样,通过检测大量数据中的模式来运作。AI工具能够检测这些模式,因为它们可以“学习”,或者被训练以识别数据中的特定特征。然而,使用以某种方式偏斜的数据进行训练的医学AI工具可能会表现出偏见,而当这种偏见与不公正的模式相符时,使用这些工具可能会导致不平等和歧视。虽然试图修复用于AI训练的有偏临床数据的技术解决方案是出于善意的,但支撑所有这些倡议的基本概念是,有偏的临床数据就像“垃圾”,就像计算机科学的格言“垃圾进,垃圾出”所指的意思。相反,作者提出将临床数据视为信息产物,当审视这些产物时,它们可以为所在的社会和机构提供信息。将有偏的临床数据视为信息产物可以识别医学和卫生保健领域中的价值观和不平等模式。将临床数据视为信息产物进行审视还可以为当前的医学AI开发方法提供替代方案。此外,将数据视为产物的这种框架将修复有偏AI的方法从狭义的技术观点扩展到了社会技术的视角,考虑历史和当前的社会背景作为解决偏见的关键因素。这种更宽泛的方法有助于实现公共卫生目标,理解人口不平等问题,还为将AI用作检测与健康平等相关的种族和民族纠正、缺失数据和人口不平等模式的新方法提供了可能。

我们正目睹人工智能(AI)的崛起。像ChatGPT和DALL-E这样的AI工具似乎能够模仿人类智能,但它们实际上是计算机程序,用于对数据进行分类、归类、学习和过滤,以解决问题、做出预测和执行其他看似智能的任务。在医学领域使用的AI工具,就像在其他领域使用的AI一样,通过在大量数据中检测模式来工作。例如,AI可以在经过大量异常图像的训练后,学会检测医学图像中的异常情况。医学AI展示了令人印象深刻的能力,尤其是在放射学领域。一些AI工具在识别医学图像中的疾病方面,至少与经验丰富的放射科医师一样准确。然而,如果医学AI工具是通过某种方式偏倚的数据进行训练的,这些工具可能会表现出偏见。例如,可以开发一个AI工具来检测胸部X射线片中的疾病。该工具将通过使用由成千上万张有病或无病的胸部X射线片组成的数据集进行训练。AI将从这些图像中学会识别疾病。然后,当展示一张新图像时,AI工具将能够确定胸部X射线片上是否存在疾病的证据。理想情况下,该工具在识别疾病方面应该非常准确,对所有人也应该准确无误。然而,如果训练数据中包含具有特定特征的图像过多,比如特定大小或形状的胸部,或者标记图像是否显示疾病的方式存在差异,那么该工具将出现偏见。

图 1

医学AI工具,就像其他AI应用一样,可能会因为训练数据中的偏见而变得有偏。这种偏见可能反映了社会不平等。最近一篇探讨基于胸部图像进行疾病诊断的AI使用的文章指出,即使使用数千张图像的数据集进行训练,AI模型在为弱势群体和种族和族裔少数群体进行诊断时表现出一种低诊断率的模式。这种模式在交叉群体(如黑人和西班牙裔女性)中尤为明显。像这样的医学AI工具不仅存在偏见,还是健康不平等的根源,因为在弱势群体和种族和族裔少数群体中已经存在不公正的健康差距(图1)。例如,在美国,黑人比白人更不太可能得到肺癌早期诊断。在这个例子中,AI偏见,也被称为算法偏见,具有重要影响,因为它可能导致算法歧视。美国总统府科学技术政策办公室最近在其《AI权利法案蓝图》中将算法歧视确定为一个关键问题。研究和学术界也认识到AI偏见可能演变为算法歧视的潜在可能性。一些人提出了技术解决方案,例如试图修复用于AI训练的有偏临床数据。修复训练数据的一种方法是通过将来自不同临床机构的数据进行汇集,从而包含人口统计学上代表性的数据集。其他解决方案包括通过为某些人口统计类别缺失的数据进行填充,或者在不存在数据的地方创建新的合成数据,从而人为地创造人口统计多样性。美国国立卫生研究院最近推出了“Bridge2AI”计划,这是一项耗资1.3亿美元的努力,旨在从零开始构建多样化的数据集,以用于培训和构建新的医学AI工具。

不仅仅是偏见

尽管所有这些努力都是出于善意的,并且可以在减少人工智能偏见和相关歧视方面取得一些进展,但支撑所有这些倡议的核心概念是,倾斜的临床数据就像计算机科学中的“垃圾进,垃圾出”一样,意味着糟糕或有缺陷的数据会导致不良的分析结果。尽管认识到倾斜或缺失的数据可能导致算法性偏见和歧视,但作者提出了一种人工智能偏见的替代方法。作者将这些数据视为历史信息产物,从考古学和历史的角度看,历史产物是可以提供关于社会、包括制度、活动和价值观的信息的物体。工具之所以重要,是因为它们可以揭示早期社会的情况,即使它们揭示的信仰和实践可能与当代社会的信仰和实践不一致。以类似的方式,我们可以将用于AI的临床数据视为产物,这些产物可以揭示可能令人不悦的事实。例如黑人患者的医疗支出低于白人患者,导致分配医疗资源不平等的算法。当将倾斜的临床数据视为信息产物而非垃圾时,我们可以利用AI中的模式识别能力来帮助我们理解这些模式在历史和当代社会背景下的含义。

健康数据产物与价值观

近年来,人们越来越关注在临床数据中应用种族和民族矫正方法。例如,2021年,慢性肾脏病流行病学合作组织报道了一种新的方程,用于估算肾功能的一种指标(肾小球滤过率),而无需使用种族矫正。该方程以前会“矫正”黑人的肌肉质量明显较高的假设。研究已经表明,在医学中的种族矫正实践可以追溯到将白人男性的身体作为参照标准或规范,用以衡量其他身体和生理功能。尽管遗传祖源可能提供一些临床相关信息,比如具有对抗疾病的遗传变异, 但越来越多的人认识到,医学中一些关于种族和民族的矫正需要重新评估,因为支持这些矫正的证据可能已经过时,使用这些矫正可能会加深健康不平等。了解医学临床数据中种族矫正的历史很重要,因为临床预测模型可能基于一种逻辑,即种族与生理学的某些方面(如肺功能)之间存在生物学决定性的关系。这些数据和假设然后可以纳入医学AI工具的开发中。看似看不见的偏见,比如在临床数据中进行种族“矫正”,如果不认识到种族矫正的历史,往往很难通过纯粹的技术手段来修复。虽然在当代医学中否认了白人正常或至上主义等种族主义价值观,但如果将这些数据用作训练集,这些价值观可以影响当前实践以及未来医学AI工具的开发。跨学科团队对临床数据进行上游分析,可以揭示重要但隐含的历史和其他因素塑造了这些数据。这种干预可以帮助识别将导致下游歧视性AI工具的数据,并提出解决这些偏斜数据深层原因的干预措施,比如重新评估临床实践中的种族矫正。

健康数据的产物和实践

将有偏差的健康数据视为值得仔细研究的历史信息产物,还可以识别出医疗保健实践问题,从而指引解决与数据和数据中心工具(如AI)相关问题的社会技术解决方案。例如,性别认同在临床数据中经常缺失。我们不仅可以考虑修复这些数据或放弃我们已经拥有的海量数据,还可以检查这些数据所呈现的丰富信息,并思考数据缺失暗示了关于临床和社会实践的内容,比如在临床用语中涉及性别和性别的术语不一致以及在医疗接诊表格中继续使用过时的性别认同术语,这些术语可能不适用于每个人。缺失的数据还可能表明,一些人可能不愿意或不支持披露这些信息,并且医护人员可能缺乏收集这些信息的培训或权威。健康数据的产物方法还有助于发挥AI的能力,提出新的应用。因为AI可以快速识别模式,它可以发现临床数据中的缺失,比如某些种族群体的缺失,这可以作为一种假设生成工具,可以催生关于临床护理和健康不平等的新的跨学科研究。

健康数据的产物和不平等模式

将健康数据视为产物而不是垃圾,还可以帮助揭示在医疗保健领域不同人群之间的不平等模式。不幸的是,在美国的少数族裔群体中存在许多不公平的健康差距,或称为健康不平等。健康数据反映了这些差距。如上所述,黑人患者的肺癌更有可能在晚期诊断,而不是在白人患者中。如果用于训练癌症预测算法,数据中的这种偏差可能会预测黑人患者的存活率较低。进一步,这种较低的预测存活率可能会影响提供给这些患者的治疗选择,特别是在倾向于预计有更好疗效的患者的治疗分流或配给系统的情况下。然而,将这些数据视为信息产物可以帮助揭示不平等模式,将这些诊断差异凸显出来。这些数据的历史表明,仅在2年前,肺癌筛查指南发生了问题,因为它们过分地将黑人列为不适合进行早期癌症筛查的人群。

结论

作者建议将注意力从健康数据的不足转向将这些数据视为人类活动和价值观的历史信息产物。考古学等领域的产物分析与殖民主义剥削的历史有关,这带有一定的讽刺意味。将医疗保健数据视为信息产物,提供了一种考虑历史和当前社会背景的社会技术方法。这种扩展方法有助于实现公共卫生的目标,即了解人口不平等,并提出了利用AI检测与卫生平等相关的数据模式的新方法。作者提出这种重新构思,以便医疗保健领域的AI开发可以反映我们对确保现在和未来的平等医疗保健的承诺和责任。

参考资料

Ferryman, K., Mackintosh, M., & Ghassemi, M. (2023). Considering Biased Data as Informative Artifacts in AI-Assisted Health Care. New England Journal of Medicine, 389(9), 833-838.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
HTTPS 和 SSL/TLS 协议:密钥交换(密钥协商)算法及其原理
前一篇介绍了 SSL/TLS 的身份认证机制。这个机制是为了防止攻击者通过【篡改】网络传输数据,来假冒身份,以达到“中间人攻击/MITM”的目的。   而今天要聊的“密钥协商机制”是:(在身份认证的前提下)如何规避【偷窥】的风险。   通俗地说,即使有攻击者在偷窥你与服务器的网络传输,客户端(client)依然可以利用“密钥协商机制”与服务器端(server)协商出一个用来加密应用层数据的密钥(也称“会话密钥”)。
全栈程序员站长
2021/06/17
10.3K0
基础知识补充3:对称加密与非对称加密简介
对称加密是最快速、最简单的一种加密方式,加密(encryption)与解密(decryption)用的是同样的密钥(secret key)。
春风大魔王
2020/07/29
2K0
非对称密钥沉思系列(4):密钥交换
密钥交换,也有称作密钥协商,这套机制,最主要的作用是用来得到通信双方的临时会话密钥。
bowenerchen
2023/01/04
7.2K13
非对称密钥沉思系列(4):密钥交换
一文读懂https中密钥交换协议的原理及流程
http与https区别:HTTP 由于是明文传输,所以在安全性上存在以下三个风险:
绿盟科技研究通讯
2022/06/06
8.3K0
一文读懂https中密钥交换协议的原理及流程
TLS加密套件之密钥交换
TLS是固定格式,一般在ng配置的时候是不需要配置TLS_这一部分的,直接从密钥交换开始算。
西门呀在吹雪
2023/08/10
9760
TLS加密套件之密钥交换
【腾讯TMQ】从 wireshark 抓包开始学习 https
腾讯移动品质中心TMQ
2017/02/22
6.7K0
TLS协议分析 (五) handshake协议 证书与密钥交换
当服务器确定了CipherSuite后,根据CipherSuite里面的认证算法,如果需要发送证书给客户端,那么就发送 Server Certificate消息给客户端。Server Certificate总是在ServerHello之后立即发送,所以在同一个RTT里。
用户8964349
2021/09/07
1.7K0
即时通讯安全篇(十一):IM聊天系统安全手段之传输内容端到端加密技术
本文由融云技术团队分享,原题“互联网通信安全之端到端加密技术”,内容有较多修订和改动。
JackJiang
2022/08/29
2.1K0
即时通讯安全篇(十一):IM聊天系统安全手段之传输内容端到端加密技术
大型网站的HTTPS实践(一)---HTTPS协议和原理
1前言 百度已经于近日上线了全站HTTPS的安全搜索,默认会将HTTP请求跳转成HTTPS。本文重点介绍HTTPS协议,并简单介绍部署全站HTTPS的意义。 本文最早发表于百度运维部官方博客 2 HTTPS协议概述 HTTPS可以认为是HTTP + TLS。HTTP协议大家耳熟能详了,目前大部分WEB应用和网站都是使用HTTP协议传输的。 TLS是传输层加密协议,它的前身是SSL协议,最早由netscape公司于1995年发布,1999年经过IETF讨论和规范后,改名为TLS。如果没有特别说
小小科
2018/05/02
1.4K0
大型网站的HTTPS实践(一)---HTTPS协议和原理
WhatsAPP通讯协议端对端加密人工智能[通俗易懂]
本文是一个以 whatsapp 为案例的,针对端对端聊天加密通讯协议整理的一个学习笔记,仅供大家学习。Signal protocol 是真正的端到端的通讯加密协议,号称是世界上最安全的通讯协议,任何第三方包括服务器都无法查看通讯内容。全篇都是围绕着 Signal protocol 进行梳理和解释,学习的内容大致分为三个大部分:1、术语解析 2、了解5577850怎么来的3、WhatsAPP 的通讯流程。
全栈程序员站长
2022/06/26
4.6K0
WhatsAPP通讯协议端对端加密人工智能[通俗易懂]
HTTPS 握手会影响性能吗?废话,肯定会
由裸数据传输的 HTTP 协议转成加密数据传输的 HTTPS 协议,给应用数据套了个「保护伞」,提高安全性的同时也带来了性能消耗。
小林coding
2022/10/27
1.2K0
HTTPS 握手会影响性能吗?废话,肯定会
基于 TLS 1.3的微信安全通信协议 mmtls 介绍(上)
张绍文
2017/07/20
20.1K1
基于 TLS 1.3的微信安全通信协议 mmtls 介绍(上)
加密算法的前世今生
本文讨论的加密算法要解决的主要是信息传输中的加密和解密问题。要假设数据传输过程是不安全的,所有信息都在被窃听的,所以发送端要把信息加密,接收方收到信息之后,肯定得知道如何解密。
帅地
2020/02/21
7970
加密算法的前世今生
面试官你不要说我不懂TLS握手了
非对称加密主要用来保护对称加密密钥交换的安全性,一旦客户端和服务端交换密钥完成,即可使用密钥采用对称加密的方式进行通信。
shysh95
2021/11/25
7160
面试官你不要说我不懂TLS握手了
HTTPS网络安全与SSL证书相关术语合集
EV证书(Extended Validation Certificate)是一种根据一系列特定标准颁发的X.509电子证书,根据要求,在颁发证书之前,证书颁发机构(CA)必须验证申请者的身份。不同机构根据证书标准发行的扩展验证证书并无太大差异,但是有时候根据一些具体的要求,特定机构发行的证书可以被特定的软件识别
Yangsh888
2022/03/24
1.5K0
这 HTTPS,真滴牛逼!
其中,RSA 是比较传统的密钥交换算法,它不具备前向安全的性质,因此现在很少服务器使用的。而 ECDHE 算法具有前向安全,所以被广泛使用。
小林coding
2021/01/26
1.7K0
NodeJS加密算法(一)
对称密钥算法DES、AES都属于分组密码,分组密码的特点是分组的长度是固定的。但是由于明文的长度不固定且基本超过分组长度,所以就需要进行多轮的迭代加密。模式就是指的多轮迭代的方式。
皮小蛋
2021/02/08
2.3K0
TLS握手:回顾1.2、迎接1.3
HTTPS或者说SSL or TLS现在都是老生常谈的东西了,为什么还要写这篇文章?
FB客服
2019/05/16
1.5K0
基于TLS1.3的微信安全通信协议mmtls介绍
编者的话:近年来网络安全事件层出不穷,确保亿万用户的安全隐私是我们微信义不容辞的责任。当然,我们更要保证用户稳定、快速的聊天体验,所以我们有了mmtls。文章干货满满,建议大家阅读全文,仔细品味! 一、背景   随着近些年网络安全事情的频繁发生,使得用户对网络通信安全的意识越来越强。国内外的网络服务提供商都逐渐提供全站的安全通信服务,如国内的淘宝、百度先后宣布已经完成了全站部署https。微信现有的安全通信协议是基于用户登录的时候派发的SessionKey对应用数据进行加密的,该协议在工程实现上,已经过多
微信终端开发团队
2018/01/29
6.3K0
基于TLS1.3的微信安全通信协议mmtls介绍
密码学小白必知必会
本文是以介绍密码学基本概念为目的,面向密码学小白或者新人的文章。包含的内容主要是一些课本知识,个人理解,还有一些实例及代码。下面,将从密码学的基础,应用,及实例等几个方面对密码学进行简单的介绍。
zenlu
2024/02/20
6110
密码学小白必知必会
推荐阅读
相关推荐
HTTPS 和 SSL/TLS 协议:密钥交换(密钥协商)算法及其原理
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档