前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【专家痛陈AI医学影像三大难点】数据规模小、标注质量差、懂算法的不懂医疗

【专家痛陈AI医学影像三大难点】数据规模小、标注质量差、懂算法的不懂医疗

作者头像
新智元
发布于 2018-03-22 03:44:05
发布于 2018-03-22 03:44:05
2.6K0
举报
文章被收录于专栏:新智元新智元

【新智元导读】中金公司(CICC)此前发布的人工智能相关领域证券研究报告指出,数据获取、数据标注和跨学科人才积累已经成为医疗影像识别进一步推进的三个关键点。深睿医疗 CEO 乔昕更犀利地指出:“目前应用人工智能对某些症像的识别取得了进展, 但是此项技术不论在国内还是国外都还没有开始大规模的临床验证,甚至缺乏验证的技术和科学方法。 ”来自医学界的多位专家则表示,“来自临床的需求是医学影像发展的动力”、“医疗 AI 产品也是医疗产品,是医疗产品就要遵循临床指南和医学路径,不然就不会被医生接受”。

三大难点:数据规模小、标注质量差、懂算法的不懂医疗

深度学习为代表的人工智能技术将最先驱动哪一个产业或行业实现全面升级?如果这是一场赌马比赛,那么最被大家看好的快马中,一定有一匹叫做“智能医疗”。

中金公司(CICC)6 月 19 日发布的人工智能相关领域的证券研究报告指出,语音交互、计算机视觉、认知计算等技术蓬勃发展,助推了语音录入病例、医疗影像智能识别、辅助诊疗/癌症诊断、医疗机器人、个人健康大数据等多个具体医疗应用场景取得快速突破。

对于其中的医疗影像智能识别,报告指出,目前上市公司和创业公司正在纷纷布局,整体处于商业化初期阶段。而医疗影像识别的主要难点在于数据获取、数据标注和跨学科人才积累。

  • 数据获取:数据是深度学习算法所需的核心资源,仅掌握算法而缺乏数据无法获得较好的训练效果。现阶段,我国的医疗影像仍处于从传统胶片向电子数据过渡的阶段,大量影像资料尚未数字化,且医院之间的数据共享和互通程度较低,获取大规模的数据对业内公司是一个考验
  • 数据标注:在获取数据的基础上,深度学习结合先验知识对模型进行训练,训练集需要事先标注。由于大多数标注依赖人工识别,因此数据标注将耗费较大量人力和时间,在医疗影像领域获取具有高可靠性的标注数据也成为挑战之一
  • “AI+医疗”跨学科人才积累:在较为专业的诊疗领域,应用及平台开发者不仅要研究人工智能算法,更要对医疗影像识别建立深入了解,人工智能+医疗的复合背景人才构成核心竞争力之一

“现在很多公布的结果都经不起推敲”

而报告所指出的医疗影像智能识别的这三个难点,也恰恰成为了这一领域发展的痛点,甚至许多行业乱象正是由此滋生。谈到这一问题,深睿医疗的 CEO 乔昕感触颇深。

“随着人工智能技术在医学影像领域的兴起,各种各样的国际国内大赛、评比、甚至所谓的人机大赛搞得轰轰烈烈,公布的成绩从85、90 提升到所谓的 95、98,令人目不暇接,各路人马高唱凯歌,大有接替医生之势。我们在为技术进步感到欣喜的同时,的确应该正确的理解和看待这些先进的科学技术。”

“首先医学是一门注重实践、依赖循症的科学。简单来说,新兴技术需要医生通过长期的实践,分析总结,找到科学依据,再通过现代统计学的科学方法结合临床实践得到最大可能的验证。这是一套完整的科学体系。”

目前应用人工智能对某些症像的识别取得了进展, 但是此项技术不论在国内还是国外都还没有开始大规模的临床验证,甚至缺乏验证的技术和科学方法。

“一旦我们开始讨论这个问题就会发现,现在很多公布的结果都经不起推敲。首先是数据的来源和质量,再者就是对结果的评判也需要一个科学的评估标准和体系。”

“目前市场上大部分公司的数据来源是 2-3 家医院,这实际上数量和质量是远远不够的。以 CT 为例,医院在用的各种 CT 机型有近百种,厂家有7、8家。在产品化的过程中,如果仅使用几个机型的数据,或者下载公开数据集的数据来训练模型,即使实验室准确率很高,也很难在实际应用中取得很好的效果。这种影像数据的的差异来源于设备的设计上的不同,使用上执行标准和指南的偏差,甚至对使用成本核算上的考量。”

“另外,GE、西门子、飞利浦等公司的大型医疗设备也在不断的更新,国产品牌快速崛起,而医疗AI公司研发的产品是否可以适应市场上90% 的影像设备,是这样的产品进行市场推广的前提。”

这一席话确实道出了困扰医疗影像智能识别发展的一些根本问题。我们这位很敢说的 CEO 拥有丰富的医疗知识背景。他毕业于浙江大学生物医学工程专业,先后就职于北京大学临床第三附属医院, 西门子(中国)有限公司医疗部。历任西门子医疗东北亚CT事业部总经理,西门子(中国)医疗事业部大中华区副总裁,医疗服务业务领域总裁。在行业内,乔昕本身就拥有很高的声誉。

他所在的深睿医疗成立时间不长。2015年年初开始,百度创始七剑客之一雷鸣带领8 名博士进行智能医疗影像的探索,今年年初研究成果用于所以验证后,正式成立公司并获得 3500 万元人民币的A轮融资。目前已经完成第一款用于肺癌早期筛查的医疗影像诊断系统,并在多家三甲医院进行试用。

中金报告所指出的跨学科人才难点,恰恰是深睿医疗的一项显著优势。

深睿医疗目前已经组建了近50 人的团队。科研团队主要由来自北大和中科院的博士硕士组成,工程团队由来自BAT等一线互联网公司的研发人员组成,团队成员曾在ICCV、AAAI、CVPR 等顶级会议发表多篇文章。公司销售副总裁Sally.Yang(美籍)为原Terrecon中国区总经理,市场副总裁李朝阳先生为原西门子市场总监,临床科研总监信颖医学博士为原西门子医疗资深临床专家,医疗团队成员中多人拥有医学影像硕士博士学位,有着多年医学影像诊断经验,与国内医院影像科、临床科室保持长期关系。而我们所采访到的 CEO 乔昕,则更是具有深厚的医疗行业背景与资源。创始核心团队人才的高度复合性,成为了投资方看好这家公司的重要原因。

“产品化比科研更难:找新的数据,找新的标注,找新的思路”

医疗影像数据的质量和标注难题,深睿医疗自然也遇到过。乔昕表示,深睿医疗的主要团队在成立前就已经在从事医疗 AI 产品的研发,尤其是肺结节的筛查,在公司成立的时候,已经能取得很高的准确率了。“但是在进行产品化的工作中,我们还是遇到了大量的数据差异化的问题。为了能够适应更多的使用条件,我们回过头来,从科研的角度,找合作医院、找新的数据、找新的标注、找新的思路,然后把问题克服掉。”一路走下来,乔昕感觉产品化的难度一点不比科研的难度小。

目前深睿医疗的肺癌早期筛查的产品已经克服了各个医院数据不统一、标准不统一的问题,产品开始在多家医院试用。

另外,乔昕补充说,他们最初的产品定位是给基层医疗机构提供服务的,基层医疗机构拍摄出来的影像与三甲医院比起来,要复杂得多,质量、标准化等差距非常大,但是基层医院有较大的需求,要想在基层医院得到推广,就必须要克服这些问题。这个过程需要团队有很深的临床功底,对基础医疗以及各个医院的情况有很深的了解,才能做到。

“为了保证数据标注的质量,在系统训练前,数据会交由至少两位以上的资深医学专家进行标注,如果标注结果不一样,我们会再聘请一位更高资历的专家来确定标准,这样确保用于训练的数据是可信的。虽然这样做成本会更加,但这也确保了系统的准确性。”

此外,乔昕强调,目前深睿医疗没有去一味的追求使用的数量而是非常注重产品的普适性,他们在尽量用各种各样的临床数据来验证他们的产品。

“只有临床认可,AI 医学影像才有价值”

作为在医疗领域深耕多年、有深厚医疗行业背景与资源的乔昕,对于 AI 医学影像和临床的关系有深刻认识。他认为,AI医学影像最终是服务于临床的,其真正的价值要获得临床的认可。

这一点获得了深睿医疗医学顾问金征宇教授的赞同。金征宇教授是中华医学会放射学分会候任主任委员,北京医学会放射·学分会主任委员,中国医学装备协会副理事长,中国医学影像技术研究会副会长,北美放射学会(RSNA)终身会员,中华放射学杂志副主编。他非常关心 AI 技术的发展,也非常认可深睿注重临床需求的发展理念。“来自临床的需求是医学影像发展的动力,而深睿医疗在这方面取得了显著的成绩”,金教授这样告诉新智元。

中华医学会放射学分会候任主任委员金征宇(左)和深睿医疗 CEO 乔昕

金教授说:“目前医疗数据80%以上来自医学影像数据,随着医学影像技术的高速发展,一方面海量数据为临床提供了更多信息, 另一方面对影像科医生的培养和知识更新换代提出了巨大的挑战。AI 在医学影像领域具有广泛的应用前景,可以辅助医生提高诊断准确性,降低工作强度,提高工作效率”

南京军区总医院医学影像科主任卢光明教授

南京军区总医院医学影像科主任卢光明教授对于AI技术在医院的应用也充满了希望: “在确保数据信息标准有效前提下的医学影像AI,不仅可以进入医院用于临床,甚至还可以结合各种组学的研究,进一步拓展医学影像信息的临床价值的边界”。

医学影像报告出具以后会传给临床医生,临床科医生会根据指南,结合患者的其他临床数据和身体特征判断患者如何进行下一步治疗,因此影像科医生必须了解临床需求,了解各种指南的临床意义,提供给临床有价值的医学影像信息是影像科医生的职责。不能臆断临床需求。这本身也是对医疗影像智能识别系统的严峻挑战。

“归根结底,医疗 AI 产品还是医疗产品,是医疗产品就要遵循临床指南和医学路径,不然就不会被医生接受。”乔昕说。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-09-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
​【刘文彬】以太坊RPC机制与API实例
原文链接:醒者呆的博客园,https://www.cnblogs.com/Evsward/p/eth-rpc.html
圆方圆学院
2018/12/24
1.9K0
探索查看以太坊交易池的方法
以太坊主网的内存池(称为交易池或 txpool)是动态内存中的区域,在那有待处理的交易驻留在其中,之后它们会被静态地包含在一个块中。
Tiny熊
2022/11/07
2.1K0
探索查看以太坊交易池的方法
以太坊应用开发接口:JSON RPC API
以太坊应用开发接口指的是以太坊节点软件提供的API接口,去中心化应用可以利用这个接口访问以太坊上的智能合约。以太坊应用开发接口采用JSON-PRC标准,通常是通过HTTP或websocket提供给应用程序调用。
用户1408045
2019/03/12
1.6K0
Microsoft Azure 以太坊节点自动化部署方案漏洞分析
作者:sunsama@知道创宇404区块链安全研究团队 时间:2018/07/10
Seebug漏洞平台
2018/07/26
6310
Microsoft Azure 以太坊节点自动化部署方案漏洞分析
动手编写一个以太坊智能合约
如何部署、调用智能合约 1RPC 之前的章节中讲到了怎么写、部署合约以及与合约互动(点击阅读上一章节)。现在该讲讲与以太坊网络和智能合约沟通的细节了。 一个以太坊节点提供一个RPC界面。这个界面给Ðapp(去中心化应用)访问以太坊区块链的权限和节点提供的功能,比如编译智能合约代码,它用JSON-RPC 2.0规范(不支持提醒和命名的参数) 的子集作为序列化协议,在HTTP和IPC (linux/OSX上的unix域接口,在Windows上叫pipe’s)上可用。 2惯例 RPC界面会使用一些惯例,但它们不是
区块链大本营
2018/05/10
7080
Microsoft Azure 以太坊节点自动化部署方案漏洞分析
为了迎合以太坊区块链1发展需求,Microsoft Azure2早在2016年9月九推出了以太坊节点走自动部署的模块。部署情况如下:
Seebug漏洞平台
2018/07/12
1.1K0
探路以太坊
关键字:以太坊,加密货币,crowdsale,geth,console,web3.js 以太坊简介 一句话简介:以太坊是一个基于功能齐全的编程语言构建的众多去中心化区块链应用的平台。 下面来解读一下这句话: 平台:首先以太坊是一个平台,这个平台上面有很多应用。 应用:这些应用是是去中心化的,基于区块链技术。所以这些应用可以实现永不停歇,因为它是分布式的,去中心化的,基于P2P网络的,这些应用被管理在以太坊钱包上面。 钱包:以太坊钱包,本质上以太坊钱包也是其中一个应用,它是一个网关,可以管理所有基
文彬
2018/05/03
2K0
python通过web3py链接以太坊区块链节点的几种方式
通信服务提供接口是web3如何与区块链交互的关键。接口接受JSON-RPC请求并返回响应。这通常通过将请求提交给基于HTTP或IPC套接字的服务器来完成。
笔阁
2018/10/25
2.9K0
以太坊客户端Ethereum Wallet与Geth区别简介
程序新视界
2018/01/08
2.2K0
【深度知识】RPC原理及以太坊RPC的实现
Remote Procedure Calls 远程过程调用 (RPC) 是一种协议,就是从一台机器(客户端)上通过参数传递的方式调用另一台机器(服务器)上的一个函数或方法(可以统称为服务)并得到返回的结果。 通常的实现有XML-RPC , JSON-RPC ,通信方式基本相同, 所不同的只是传输数据的格式。
辉哥
2019/08/08
3.4K0
区块链与以太坊实战(5):访问以太坊节点的N中方式
本文主要介绍用web3.js访问以太坊节点的几种方式,主要包括HTTP和Web两种访问方式。
蒙娜丽宁
2020/07/15
2.5K0
理解以太坊: Go-Ethereum 源码剖析(0): Geth Start
Geth[2] 是基于 Go 语言开发以太坊的客户端,它实现了 Ethereum 协议(黄皮书)中所有需要的实现的功能模块,包括状态管理,挖矿,P2P 网络通信,密码学,数据库,EVM 解释器等。我们可以通过启动 Geth 来运行一个 Ethereum 的节点。Go-ethereum 是包含了 Geth 在内的一个代码库,它包含了 Geth,以及编译 Geth 所需要的其他代码。在本系列中,我们会深入 Go-ethereum 代码库,从 High-level 的 API 接口出发,沿着 Ethereum 主 Workflow,从而理解 Ethereum 具体实现的细节。
Tiny熊
2022/05/25
2.3K0
福利|评价超高的《精通以太坊》丛书免费送,还包邮!手慢无
在去中心化应用中,发送给节点的请求通常被称为“交易”。交易和普通的请求有很大不同,即交易的数据经过用户个人签名之后发送到节点。
区块链大本营
2018/11/07
1.2K0
第三课 以太坊术语说明及开发者资源列表
也称钱包,提供账户管理、挖矿、转账、智能合约的部署和执行等等功能,以太坊节点利用以太坊客户端接入到以太坊网络。 现在以太坊客户端主要有:Wallent/ist , Geth, Parity, Harmony,
辉哥
2018/08/10
7960
第三课 以太坊术语说明及开发者资源列表
金钱难寐,大盗独行——以太坊 JSON-RPC 接口多种盗币手法大揭秘
2010年,Laszlo 使用 10000 个比特币购买了两张价值25美元的披萨被认为是比特币在现实世界中的第一笔交易。
Seebug漏洞平台
2018/08/16
1.3K0
金钱难寐,大盗独行——以太坊 JSON-RPC 接口多种盗币手法大揭秘
以太坊介绍和使用
以太坊是一个能够在区块链上实现智能合约、开源的底层系统。换言之,以太坊是可编程的区块链,它并不是给用户一系列预先设定好的操作(例如比特币交易),而是允许用户按照自己的意愿创建复杂的操作。这样一来,以太坊是就可以作为多种类型去中心化区块链应用的平台,这些应用比如包括之前很火的各种代币但并不仅限于此,我们可以做很多除了代币之外的东西,比如你可以输出一行代表自己不是外行身份的hello world,或者在上面做一个简单的计算器,总之你可以在上面实现你想要的任何功能。
fnatic
2022/07/15
37.4K0
干货 | 以太坊工具集合,解决你的入门困难
如果你是一名区块链或以太坊新手,一开始接触以太坊生态系统中的工具和技术时很可能会像我一样一头雾水。为了让大家对以太坊的技术生态有一个整体的了解,并熟悉各部分的组合,本篇文章就将对以太坊学习中经常会遇到
区块链大本营
2018/06/19
9110
区块链开发(一)搭建基于以太坊go-ethereum的私有链环境
通过各方资料了解学习之后,决定自己开始搭建基于以太坊go-ethereum的私有链环境。由于本人的电脑系统为win8,为避免window环境出现过多莫名其妙的问题,特意通过vm搭建了一台ubuntu16.04版本的虚拟系统。以下内容均基于ubuntu16.04系统。
程序新视界
2022/05/06
9520
区块链开发(一)搭建基于以太坊go-ethereum的私有链环境
web3j开发java或android以太坊智能合约快速入门
web3j是一个轻量级、高度模块化、响应式、类型安全的Java和Android类库提供丰富API,用于处理以太坊智能合约及与以太坊网络上的客户端(节点)进行集成。
笔阁
2018/09/04
2.5K0
以太坊中GraphQL简介及使用
以太坊在去年升级的go-ethereum(geth)1.9.0大版本,除了性能得到大幅提升之外,引入了GraphQL,一种节点接口查询机制,用以补充JSON-RPC。
Tiny熊
2020/06/01
1.6K0
以太坊中GraphQL简介及使用
推荐阅读
相关推荐
​【刘文彬】以太坊RPC机制与API实例
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档