近日,一项经过同行评审的研究显示,谷歌的人工智能医疗聊天机器人在美国医疗执照考试中取得了及格成绩,但其答案仍不及人类医生。去年,由谷歌竞争对手微软支持的开放AI发布的ChatGPT引发了科技巨头在新兴的AI领域的竞争。尽管AI的未来可能性和危险性引起了广泛关注,但在健康领域,这项技术已经取得了实质性的进展,其算法能够像人类一样阅读某些医疗扫描。
正文:
谷歌首次公开了其用于回答医疗问题的AI工具Med-PaLM,这是在去年12月的一项预印版研究中。与ChatGPT不同,Med-PaLM并未向公众发布。美国科技巨头谷歌表示,Med-PaLM是首个通过美国医疗执照考试(USMLE)的大型语言模型,这是一种在大量人类文本上进行训练的AI技术。在美国,医学生和实习医生需要参加USMLE考试,及格线大约在60%左右。
今年2月,一项研究称ChatGPT已经取得了及格或接近及格的成绩。在周三发表在《自然》杂志上的一项经过同行评审的研究中,谷歌研究人员表示,Med-PaLM在USMLE风格的多项选择题中取得了67.6%的成绩。研究称,“Med-PaLM的表现令人鼓舞,但仍不如临床医生。”
为了识别并减少“幻觉”——这是AI模型提供错误信息时的名称——谷歌表示,它已经开发了一个新的评估基准。谷歌研究员、新研究的主要作者Karan Singhal告诉法新社,该团队已经使用这个基准测试了他们模型的一个新版本,结果“超级令人兴奋”。
据5月发布的一项尚未经过同行评审的预印版研究,Med-PaLM 2在USMLE考试中取得了86.5%的成绩,比前一版本提高了近20%。
英国巴斯大学的计算机科学家James Davenport表示,对于这些AI驱动的医疗聊天机器人,“房间里有一头大象”。他说,回答“医疗问题和实际医学”之间存在很大的差异,后者包括诊断和治疗真正的健康问题。
英国利兹大学的AI专家Anthony Cohn表示,由于这些大型语言模型的统计性质,幻觉可能会一直是一个问题。因此,这些模型“应该始终被视为助手,而不是最终的决策者”。
Singhal表示,未来Med-PaLM可以用来支持医生提供可能未曾考虑过的替代方案。《华尔街日报》本周早些时候报道称,Med-PaLM 2自4月以来一直在美国著名的梅奥诊所研究医院进行测试。
Singhal表示,他不能谈论具体的合作伙伴。但他强调,任何测试都不会是“临床的,或面向患者的,或可能对患者造成伤害的”。相反,它将用于“可以相对容易自动化,风险较低的更多行政任务”。
知识拓展:
人工智能在医疗领域的应用已经取得了显著的进展,从辅助诊断到疾病预测,再到个性化治疗,AI正在逐步改变我们的医疗健康生活。然而,AI在医疗领域的应用也面临着许多挑战,如数据隐私、伦理问题、算法的可解释性等。因此,我们需要在推动AI技术的发展的同时,也要关注这些问题,以确保AI能够在尊重人权和保护隐私的前提下,为我们的健康带来更多的利益。
关注我,了解趣闻背后的科学小知识~~
领取专属 10元无门槛券
私享最新 技术干货