近两年,医疗AI领域可谓是热闹非凡。IT界人士和医生都在积极推动AI在医疗行业的落地应用。新的玩家和产品方案层出不穷,但真正能走向临床应用的却少之又少。原因之一就在于,医生和工程人员之间缺少足够的合作与信任。
因此,日前在成都召开的图像计算与数字医学国际研讨会(ISICDM2017),430多位来自信息科学(含计算机与电子工程等学科)、数学与医学等领域的专家学者与临床医生聚首成都,围绕人工智能+医疗、医学图像分析等话题展开了深入的交流与探讨。
作为本次大会的独家媒体,雷锋网对多位专家进行专访,并全程记录了各个精彩报告。
大会特地设置了3小时的圆桌讨论环节,让AI学者、医生和企业家同台对话,开诚布公地交流各自对“AI+医疗”的看法和希冀。
作为此次圆桌讨论的嘉宾,美国北卡大学沈定刚教授,四川省肿瘤医院周鹏博士,中华医学会病理学分会主任委员、原四川大学副校长步宏教授,视见医疗创始人陈浩博士,微软亚洲研究院副院长张益肇博士,江苏省人民医院放射科主任医师唐立钧博士,科大讯飞医CEO陶晓东博士(嘉宾名单按座位顺序从左往右进行排序),一致认为“AI+医疗”除了数据和算法,还必须要有医生的深度参与。
几位嘉宾围绕“AI在医疗领域的应用”“AI与医生的关系”“深度学习是否是‘万金油’”“深度学习在医疗中的不可解释性”,以及“医生和AI专家的合作方式”等话题展开了思想交锋。观点犀利之余不失幽默。
以下是圆桌讨论内容(上篇),雷锋网做了不改变原意的编辑:
主持人:今天的讨论主题是“AI+医疗的机遇和挑战”。首先有请几位嘉宾谈谈对“AI+医疗的机遇和挑战的看法。
沈定刚:我来自北卡罗来纳大学教堂山分校。我在上海交大拿了本科、硕士、博士学位,并于1999年前往美国约翰霍普金斯大学医学院放射科开始做医学图像分析方面的工作。我认为,人工智能或者深度学习跟我在上海交大研究的神经网络其实是一模一样的。我在2012年最早将深度学习用在了医学成像当中,我认为这项技术是非常好的。
周鹏:我是来自四川省肿瘤医院的一名影像科医生,非常有幸跟大家交流。我从2014年开始做早期肺癌筛查项目的研究,并不知不觉接触到了AI。
最近四年,我们积累了5000多例0.625毫米的标准、薄层、低剂量图像,用于计算机辅助诊断。这两年AI技术发展起来以后,我们觉得终于有机会做一个真正的全流程整体解决方案。因为AI在识别薄层图像时可以起到非常好的效果。
步宏:我也是一名医生,但我是一名思维比较反叛的医生,一直想在行业里折腾点事情。我在自己负责的中国病理医生群里率先提出了推广AI的想法,最开始大家都不了解或不想了解我在说什么。但很快大家讨论AI的热情就比我还高。另外,我供职的四川大学华西医院也刚刚成立了一个医学AI研究中心,任命我担任主任。这个医学AI中心已经运行一段时间了,可惜还没有建立起很好的状态。
我对AI的看法可以概括为以下几点:一、AI是一门非常有生命力和前景的技术,但医生和IT界人士还没有建立起信任与合作。二、医学AI技术的发展还没有走上“康庄大道”,仍然有许多问题需要解决。我在今年10月26日的中国病理大会上募集了一些项目,但这些项目没有一个真正走到了临床阶段。三、我从医三十多年,总结出一点:医学是一门非常年轻的学科,任何其他学科往医学领域的渗透都将取得非常丰厚的回报。
陈浩:我在香港中文大学读博士的时候,和团队在人机大赛中赢得了十几项冠军。我们当时和很多医院建立合作,但我总感觉离临床问题还是太远,所以毕业后又创立视见医疗这家公司。我们希望能用自己的努力真正推动医疗AI和社会的发展。
我们也意识到,目前医疗AI有些过热。如何保证行业沿着正确的方向发展呢?我认为必须医工深度结合。
张益肇:我来自微软亚洲研究院,我们研究院主要做基础研究。在微软做基础研究的专家就和斯坦福和哈佛的教授一样,需要做很多新技术的研究工作,发表论文。我们在很多不同的学术会议都发表了大量论文。
我们08年左右开始做医疗相关研究,医学影像方面的研究则是09年前后开始的。之所以做这些研究是因为,我们认为医疗从社会的各个方面——不管是对百姓生活的幸福程度,还是社会资源的消耗,都将产生非常重大的影响。我们相信人工智能技术将对推动社会做出非常大的贡献,帮助瞒住人们不断提高的医疗需求。
人工智能——目前主要是机器学习,有很大的发展空间。假如我们现在意识到数据的重要性,开始收集数据;不同学科之间交叉配合,一定可以做很多事情。
比尔·盖茨曾经讲过一句话:人们通常会高估任何技术两年后产生的影响,却低估它十年后的影响。从某种程度上来说,人工智能现在是被高估的。很多人认为,既然人工智能在围棋这么难的领域都可以打败世界冠军,那它还有什么不能做的呢?但其实不是这样的。举个例子,在座各位很多都会开车,把一部车从这里开回你家要比打败围棋冠军简单得多,但现阶段人工智能却无法完成。所以说,我们对AI的能力还没有很清晰的认识,不知道哪些是它擅长哪些是它不擅长的。
今天这种活动很有意义,可以促进IT界人士和医生的交流,加深对彼此的了解。有了充分了解的前提,我们才能在十年后将人工智能的价值发挥到最大。
唐立钧:我参加这次会议的初衷源于和李纯明教授在微信上的一次谈话。他跟我说,“李开复讲,再过十年影像科医生将全部失业,人工智能将取而代之。”为此,我特意买了李开复的书来读。读完之后,我还是不知道人工智能究竟可以达到怎样的程度。我希望借这次机会和大家好好讨论一下。
陶晓东:现在不谈AI+医疗都不好意思出去和别人吃饭,由此可见AI+医疗的机遇有多大。AI+医疗的飞速发展建立在信息化普及和大数据积累的基础之上。像刚刚张益肇院长讲到的那样,如果我们认识到了AI和医生分别能做什么,不能做什么,并让他们去做各自擅长的事情;AI+医疗将拥有非常好的机遇。
另一方面,AI+医疗面临的挑战也在于信息化和大数据。以前医生无法看到大量历史数据,现在有了信息化手段以后,大量历史数据呈现在医生面前;但医生需要的不是数据而是数据背后的信息。如何用更好的手段分析数据,是非常大的技术挑战。
现在大家都在提大数据,但数据到底有多干净,能在多大程度上帮助医生做决策,我们必须考虑清楚。假如无法从源头上控制数据的完整性和准确性,人工智能不过是“garbage in,garbage out”。
主持人:非常感谢各位嘉宾。由于每位嘉宾的职业和学科背景不同,他们对AI的看法也有所不同。我们聊“AI在医疗领域的机遇和挑战”,一大基本点就在AI技术。我们知道,这次AI浪潮的兴起源于深度学习。现在不管学术会议和期刊论文上谈的都是深度学习,给人一种深度学习可以解决一切问题的感觉。因此我想请教沈教授、陶博士和陈博士三位机器学习专家,深度学习究竟是不是“万金油”?
沈定刚:深度学习为什么比很多其他方法——比如sparse learning更好用呢?它实际上是把很多问题分解成了一个个的小问题,如果前面的layer没有完成的,由后面的layer来完成。
那么深度学习是不是真的能取代其他算法呢?我认为,任何新技术的出现——就像sparse learning一样,总是先在所有领域都尝试一遍,把容易的问题解决之后,最后就剩下了硬骨头。deep learning也是如此。
很多算法最终的应用都需要相应的专业知识,并非所有人都能用。现在连本科生都可以写深度学习的CVPR论文,但几年后会变得非常困难,你必须懂得专业知识。很多人说深度学习要取代医生,我认为这是完全不可能的。如果深度学习运用得当,确实可以解决很多问题,但你必须掌握相应的专业知识才能很好地运用它。此外,一些传统方法如果能够和深度学习结合起来,将取得更好的效果。
陶晓东:深度学习并没有那么神秘,它只是一个工具。任何工具都有它的用途和局限,我们明白它的局限在哪。就像沈定刚教授所说,不断去试,一段时间之后就知道它的边界在哪了。我们要找到合适的场景去使用这个工具,这一点很重要。
BAT的老大们曾经隔空争论,数据、场景和技术哪个重要。如果脱离应用场景,三者都可能是最重要的,但在具体场景中,肯定有一者更重要些。深度学习并不一定是最佳选择,但如果你的工具箱里只有它,那么也就只好用它。假如你还有其他工具和对专业知识的充分理解,就能找到最好的途径去解决问题。
现在有很多开源的深度学习算法,门槛非常低,但并非所有人都能理解,修改一个参数之后会有怎样的后果。这必须对深度学习有非常深的理解才行。
陈浩:深度学习确实是万金油,但油的质量如何,其效果因场景和数据的不同都会有所差异。
主持人:三位专家不仅详细介绍了深度学习,还提出了一个重要观点——深度学习只是个工具。我想告诉各位在座的听众,深度学习不只有输入和输出,大家还要了解它的层数、参数和最基本的原理,只有这样你们的科研才能继续往前。
近年来,深度学习在医学影像领域的应用取得了很好的效果,但它跟传统的临床医学路径不太一样,相当于一个“黑盒子”。我想知道医生是如何看待这个问题的,你们能否接受一个效果很好但却无法解释的“黑盒子”?
唐立钧:谢谢主持人的问题。其实刚才我也在思考这个问题。听了前面几位嘉宾的分享,我对人工智能和深度学习有了一些认识。下面我结合自身的体会简单谈谈。
十年前我在美国做访问学者的时候,非常羡慕美国的体制,他们的跨学科结合做得非常好。回到国内以后,就觉得缺少这样的环境。一方面,医院请不起理工科的学者,也不愿意付钱给他们;另一方面理工科的专家和企业家也很少来找我们。企业来找我们,一般是来卖机器而不是谈合作的。
这些年来外部环境一直在改变,我也在努力寻找跨学科合作的机会。我和东南大学计算机系的杨冠羽博士已经合作了很多年,期间我一直在思考,到底该以怎样的方式合作。杨冠羽博士是研究图像分割的,所以我们准备在这方面做些研究,但一直无法取得突破。我们的合作始终停留在申报课题,申请经费,我向他提供数据,一起发表论文的阶段。
今年我想到了一个主意,利用CT来测量肾功能的间阈值。这并不是什么新课题,但过去缺少人工智能和深度学习的手段,没有办法研究。我从今年开始,参考别人的文献做这方面的研究,也取得了一点成绩。接下来,我准备将我的研究成果写在报告里进一步推广。我举这个例子就是想说明,我并不关心使用的到底是深度学习还是其他方法,重点是要能解决我在临床上遇到的问题。
当然,学术界和企业界跟我的出发点不太一样。学术界有文章、课题方面的压力,所以他们找医生合作的主要目的是数据。他们也不关心数据的质量好坏,反正有数据就能做出东西来,再戴上深度学习的帽子就能发表论文。论文发表以后就能申请职称、课题和奖项。
企业界和学术界又有所不同,企业投入资金和资源后需要看到产出。这无可厚非,因为商场就是这样的。
但对于医生来说,我们有一点被利用了的感觉。医生的作用好像就是给学术界和企业界提供数据,作为回报,我们可以以共同作者或通讯作者的身份出现在论文中。虽然这也有一些用处,但并非我们想要的结果。
这样一来,就出现了矛盾:一方面企业投入了金钱、人力和资源,假如没有产出,他们肯定不乐意;另一方面医生贡献了数据,假如企业无法帮助他们解决实际问题,他们为什么要参与呢?我认为这是目前存在的最大矛盾。
关于“黑盒子”,我以前听过一个讲座,觉得很有道理。演讲人提到,他跟病理科医生讨论时,发现深度学习中的一个参数和病理科临床中的一个现象很吻合。如此看来,深度学习并不是“黑盒子”,而是可以用临床上已有的知识来解释的。
假如深度学习真的是“黑盒子”,我们肯定不放心,因为我们面对的是病人,再加上近些年医患关系紧张,多方面的矛盾十分尖锐。
我们每天都要看很多片子,写很多报告,容易犯错。比如,在男性患者的诊断报告上写“子宫正常”,或者在女性患者的诊断报告上写“睾丸、前列腺正常”。因为我们有时候写报告会复制模板,复制的时候光注意最重要的部分,却忽略了细节的地方。听说现在已经有了自动勘误系统,可以纠正诊断报告中的错误。我想这也属于人工智能应用的一个范畴吧。
总而言之,作为一名影像科医生,我关心的不是采用什么方法,而是要安全——不光是病人的安全,还有医生的安全。
主持人:唐主任告诉我们一个道理,不管黑猫白猫,能抓到老鼠的就是好猫。但站在技术的角度,我们总要有所突破。我想问问沈定刚教授和张益肇院长,我们有没有可能去解释人工智能的算法?
沈定刚:这个问题从理论上来说是非常难的。当然,也有人在做这方面的研究,比如在脑部疾病诊断中,分析到底是大脑哪些区域的病变导致了老年痴呆或者自闭症。方法就是把结果往前传,通过function connectivity分析究竟哪些connectivity和疾病的诊断有关。不过我认为即使能做到也非常困难,如果要做到这一点,就必须在网络设计方面做调整,要求网络非常稀疏。
我是一名工程人员,做的所有问题都是为了解决实际问题,至于解释可以通过其他方法来实现。很多事情都是难以解释的,比如你去美国的教会,牧师会劝你信上帝。你也许会反驳,我都没有看到上帝,为什么要相信他?但上帝就是无法解释的。对于我来说,能解决问题就够了。
张益肇:我觉得在某些情况下是可以解释的。应用机器学习的关键在于,如何确定它的可行度。机器不仅要做出判断,还要给出它对判断结果的自信程度。医生做诊断,随着经验的不断积累,自信心会不变增强。相对应的,机器在做判断的时候会分析输入在过去的训练数据中是常见的,还是处在边缘的。假如输入的信息是机器从来没有见过的,肯定会出问题。
举个例子,女性身上不可能出现男性的器官,这在过去是没问题的,但是现在却不好说,因为有变性人。如果机器从来没遇见过变性人,它就会很武断地说,既然是女性就不可能出现某个器官。
人的能力就强在可以综合多种情况作出判断,即使他不确定,他也知道自己是没有把握的。机器则只是一个函数,输入一个数据就会出来一个结果。虽然在某些情况下我们可以测算这个函数到底是用多少数据训练出来的,但它自己是没有自觉的。
因此,人和人工智能需要相互配合——在机器没有把握的时候,由医生来做判断,最终实现超人的智能。双方必须建立起信赖,人要知道AI这个工具在什么时候是可靠,什么时候是不适用的。我认为在很多场景中,尤其是医疗这种包含很多变化的场景,绝对不能完全依靠机器。
主持人:听完几位专家对人工智能应用的观点和技术解析。接下来我想请问步宏校长,作为一名医生您如何看待AI在医疗领域的应用?你是否赞同前面几位嘉宾的观点?
步宏:前面的几位嘉宾已经达成了很多共识。我们医生现在最怕的就是别人对我们说,“你们什么都不用管,只要给我数据,我就一定能做出成果来。”这种人我遇到过很多。我觉得,不管未来AI多么智能,如果连最基本的医学规律都不懂,只能算是另外一个星球的智能。
医学并不是一门纯粹的科学,还涉及很多人文、伦理的因素。理工科的人也许认为,只要把数据给他们就行了,但医生还必须考虑哪些信息必须隐去,因为涉及到伦理。
现在很多医生也开始做人工智能方面的研究了。我的学生也经常看理工科学者发表的论文,他们有时候会拿着论文跑过来对我说,“老师,你看!这篇论文连基本的医学常识都没有。是不是该给它加一个医学的reviewer呢?”如果真的这么做,很多论文其实根本发表不出来。论文成功发表并不代表取得了成果,只说明在你reviewer的知识范畴中这种方法是可行的,实际应用到临床当中,就会暴露很多问题。
矛盾的核心在于,理工科学者和医生之间的联络太少了。我一直想给医生们开设一个人工智能入门培训班,邀请理工科学者向我们普及人工智能的优势在哪,以及什么样的数据才是合格的。我绝不相信随便拿一堆片子就能做出研究成果来。
大家都知道,医生很忙。还有一些人虽然在医院工作,却不是医生,缺少专业的医学知识。真正能配合理工科专家做研究的医生很少。所以我们一定要把这个桥梁打通。总而言之,随便拿一堆数据发论文这种事一定是没前途的。
主持人:步校长说得非常好,也对做研究的人提出了更高的要求:不能光想着拿数据发论文,重点是解决实际的临床问题。说到解决临床问题,现在有很多公开数据集的竞赛,全球有很多团队参加这类比赛。陈浩老师的团队已经拿了好几次全球冠军了,我想问问他是如何看待这种公开数据集竞赛的,以及这种竞赛能不能解决临床问题。
陈浩:的确,2013-2016年期间,我们拿了十五项挑战赛的冠军,有些挑战赛非常正规,也有些不那么正规。我为什么参加这些比赛呢?因为没有数据。当时我还在读博士,有论文方面的压力,求论文心切。
比赛和临床问题有很多不同。首先,比赛的组织者已经把问题定义得很清楚了,甚至已经转换成了数学问题。你不用分析问题,不用和医生沟通,只要想着如何用算法解决问题就行了。
今天上午很多医生和专家都提到了淋巴结转移的问题。淋巴结转移的图像分割——也就是把所有淋巴结转移的点都找出来,好的算法可以达到88%的准确率,我们和Google都达到了这一水平。医生完成相同的任务需要半个小时,而且准确率只有73%。但医生并不在乎分割的准确率有多少,他们关心的是淋巴结有没有转移,病灶在哪。因为在实际临床过程中,医生看一张片子的时间只有五六分钟。所以说淋巴结转移的图像分割炒作成分大于实用价值,意义不大。
但如果把人工智能用在癌症的初筛上,意义则大得多。假如人工智能可以筛去阴性的结果,即使准确达不到100%,只有百分之九十九点几(和人类相当),也能在一定程度上减轻医生的负担。
我做企业的出发点之一就是想离临床更近一些,和临床医生的交流碰撞,可以帮助我意识到哪些事情有价值,哪些是没有意义的。我之前做了十几项比赛,除了PET以外,几乎所有影像领域都涉猎了一遍,但始终觉得和医生的直接交流不够。目前,我们和国内35家医院建立了合作,和医生的交流碰撞让我有了更深的理解,感觉非常舒服。产品的整个开发链条,从问题的定义、算法的开发,到产品的落地和使用反馈,从医生中出来,最后又回到医生中去,每个环节都需要医生的参与。有人也许认为,算法的开发不需要医生参与,这是不对的。前面有嘉宾提到,开发算法也需要医学领域的专业知识。
主持人:刚才陈浩老师提到,他们参加一项比赛,机器的准确率达到了88%,而医生的准确率只有73%,看起来AI似乎已经超越了人类智慧。现在有很多类似的人机对战,医生和机器在同样的场景中比试谁看得快、看得准。对于这样的人机大战,有很多不同的意见,有人质疑比赛的规范性;也有人问,即使机器赢了比赛,到最终临床落地又还有多少距离呢?我想听听周主任的看法。
周鹏:我觉得这种比赛挺好的,营造了一个很好的环境。我感觉人工智能已经形成了风口,但这股风要吹到医疗影像领域很难,要吹遍整个医疗领域更是难上加难。最近我接触了三家做图像处理的公司,每家的研究方向都不一样,我觉得有这种热度很好。我担心的是过几天就退烧了。如果这种热度能够再持续三五年,大家联合起来,一定能取得很多成果。因为中国的大部分医生都很优秀,数据也很丰富。
说到数据,必须强调一点,数据有很多种类。以CT为例,不同片子的厚度、剂量和分辨率都可能不一样。不管你基于什么样的数据和图像举行人机大战,也许只是个噱头,但是没有关系,只要有人看,可以造成风口就行。
关键是最终必须解决实际问题。我接触过很多人,并且形成了一种印象,所有人都在做一种通用的软件。我做早期肺癌筛查研究也做了很多年,但我并不想做什么CI、AI,我想做的是一套最规范的解决方案并推广开来。我觉得AI在0.05毫米的薄层图像上的准确性和敏感性肯定能超过医生,这是毋庸置疑的。未来我们肯定要降低投影的剂量,这样才能更安全。无论用AI做结节的分类还是标识,AI工程人员和医生都要联合起来,结合文献和临床信息制定好临床策略,做独立的整套解决方案,比如早期肺癌筛查的整套解决方案。
另外,我还有一个困惑,刚刚唐主任和步校长也提到过。我们医生做的所有工作都是公开的,但我们不懂AI算法;合作开发完系统之后,工程人员可以把算法移植到相似的系统,这时我们就失去了作用。也就是说,工程人员和医生缺少长期的合作关系。我认为,如果双方能长期稳定地合作,在某一个领域深挖下去,把这个领域打通,一定会比做一套通用的解决方案更有价值。而且我觉得做通用解决方案也不太现实。
主持人:周主任提到,医生要的不是一款软件,而是长期的合作伙伴。我想问问陶博士,讯飞推出了这么多医疗产品,您在和医院的合作过程中,有没有成为医生的长期合作伙伴?
陶晓东:我前面提到过,技术人员和医生的结合最重要。其实在医疗行业,技术不仅要为影像科、病理科服务,还要为临床服务。只不过我们是通过影像科和病理科医生最终服务于临床的,服务于临床是最高目标。在这个过程中,医生的指导非常重要。
我常说,要用正确的工具解决正确的问题,即先准确地定义问题,然后寻找合适的解决手段。我经常跟同事讲,一个问题如果能用九十年代的技术解决,就不要想着用2000年的技术;如果能通过人和机器一起解决,就不要想着做全自动的方案。总之,不要总想着用最新的技术,关键是要能解决实际问题。回归到医疗行业,我们要解决的是临床问题,肯定需要医生的合作,一起完成很多工作,并不断碰撞出火花。所以,我是非常愿意和医生做长期合作伙伴的。
主持人:谢谢陶博士。前面几位主任介绍过,人工智能在医疗领域有很多应用,比如肿瘤和细胞图像的分割、疾病的鉴别诊断和预后,以及三维重建等等。我想请教各位医生,你们认为除了前面这些,未来人工智能在医疗领域还有哪些应用?
唐立钧:我以科大讯飞为例,我去美国访问的时候发现,美国的医生时间也很紧。他们写报告的时候总是先口述,用录音机录音,然后交给秘书打出来。
内科和外科医生要写大病历和医疗文书,不管是用笔写还是用电脑打字速度都比较慢,需要花费很多时间和精力。如果能用语音识别来担任“秘书”的角色,在医院里肯定大受欢迎。我认为这是人工智能在医疗领域的应用之一。
现在AI和深度学习都瞄准了放射科和病理科,瞄准了图像领域。放射科是高度数字化的,有很多数字化的图像,比如眼底图,可以用于筛查糖尿病。但大多数人都存在一个思维误区,这里我必须指出:影像科医生并不是直接根据片子得出诊断结果的,还要结合病人的年龄、性别、家族史等临床资料,过程非常复杂。病理科同样如此,比如病理科医生诊断一个病人是否患有肿瘤,一定要和放射科医生和临床外科医生讨论后才能下结论。
我必须强调这一点,否则你们真以为我们就只是个“看片子的”——病理科医生看小片子,影像科医生看大片子。假如真是这样,你们不就把自己等同于一张片子了?
周鹏:我的看法差不多,只补充一点。人工智能会不断发展和完善,医学也会不断发展。与此同时病变的发生率也在改变,医生需要不断学习,利用更新的技术解决临床问题。过去几年影像科发展非常快,这得益于计算机技术的飞速发展。因此我们非常欢迎计算机领域的专家走进医疗领域,来了解医生和临床问题。但我希望你们不要光想着要数据,数据对医生其实没什么用。我希望未来我们可以共同合作,共同发展,以此共勉。
主持人:几位嘉宾的真知灼见为我们描绘了一幅人工智能医疗的美好蓝图,同时也给出了如何实现这幅美好蓝图的建设性意见。下面是ISICDM2017大会程序主席、电子科技大学李纯明教授的提问环节。
李纯明:AI不可能完全取代医生,这基本上已经取得共识。但退一步来讲,能否让AI处理容易的病例,医生只处理疑难的病例? 有医生和AI专家认为,影像科医生可以把所有片子交给AI读片,需要的话还可以给AI输入其它有用的临床信息,比如最近的饮食、家族病史,等等,由AI对容易的病例——比如90%的病例自行做出诊断或生成读片报告,剩余10%的疑难病例则交给医生。这样医生就不用处理那90%的容易的病例,只要处理那些疑难的病例。通过这种方式应用AI来减轻医生的负担,几位嘉宾同意这个观点吗?
步宏:理论上说是一定可以做到的,AI要做的就是减轻人的劳动强度。但我认为不能简单划分为AI负责简单的疾病,医生负责疑难杂症。该如何划分呢?首先要弄明白计算机擅长什么,不擅长什么;以及人擅长什么,不擅长什么。只有想清楚了这一点,做出来的东西才有生命力。
现在有很多人用AI作病理方面的研究,但做细胞学研究的很少。事实上细胞学的规律要比组织学更简单,目前已经有细胞学方面的产品在市场上应用了。比如,我们可以让机器对细胞进行扫描,筛选出22个细胞,医生只需要检查这22个细胞就行了。这种工作的特点是重复性非常强。
国际上有这样的规定:医生不可以做妇产科片子的初筛工作,要由初筛员来做。并不是医生不会看,而是医生太忙了,不可能按照规定看够那么长的时间。而且初筛员一天不能看超过100张片子,因为这种重复性工作做久了容易疲劳,这是人的弱点,反过来也是机器的长处。像前面提到的,必须三个医生坐在一起讨论的,只可意会不可言传的事情,则是机器不擅长的。因此,不能按疾病的难易划分,而要看规律的强弱。
李纯明:曾经有个医生跟我说,AI很好,至少它可以解决容易的病例,医生只要处理疑难病例就行了,大大减轻了工作负担。但我认为这里存在一个逻辑问题,让AI处理容易的病例,医生只处理疑难病例的前提是,AI必须在输出诊断结果的同时也告诉医生哪些病例是容易的,哪些病例是疑难的。但我认为AI没有自我意识,它无法告诉医生哪些问题它处理起来比较棘手,也就不可能将疑难的病例交给医生。除非把顺序倒过来,让医生先把所有病例处理完,然后挑选出其中容易的病例交给AI解决。如果这样的话,医生既然已经处理过容易的病例,既然认为它们是容易的,医生是否已经做出可靠的诊断? 还需交给AI吗?这样做是否真的减轻医生的负担?
沈定刚:我们把它当成了0和1的问题,即百分之九十的病人交给机器来处理,剩余的百分之十交给医生,但真实应用场景中不是这样的。
AI帮助医生的方式是告诉他某个病人患病的可能性。比如,医生早上来到医院,AI可以提前对所有片子进行排序,让医生在精力较旺盛的时候优先处理比较复杂的片子,简单的片子放在后面。这样就已经可以给医生带来很大的帮助了。此外,AI还可以告诉医生某张片子的哪个区域没有病变,只需扫一眼,哪些区域需要重点关注。
周鹏:疾病的难易是从诊断结果来判断的,一开始并不清晰。医生签报告的时候并非所有的事情都交给AI。当然,假如以后AI足够成熟了,不管疾病难易,我们都可以一并交给它处理,医生只需要复核就行了。假如机器的诊断结果是阴性的,医生可以不用再看,但如果出现阳性结果必须要手术,医生肯定是要复核的。总之,我觉得未来医生和AI最理想的合作方式就是把所有病人都交给AI,医生只复核对病人影响最大的结果。
李纯明:如果AI处理完后,还是要医生来复核,那么我觉得AI给医生带来的帮助还是非常有限的,并没有节省多少时间。周主任说只复核“对病人影响最大的结果”,难道对病人影响稍微小一点的就不用复核了吗?这样是否合理?
陶晓东:把难的片子交给医生看,简单的交给计算机,我认为这是不可能的。因为你必须先有一个算法判断哪些是难的,哪些是容易的,这本身就很难做到。
但机器肯定可以替医生减轻负担。我们可以把一部分机器能够解决的问题交给它处理,帮助医生变得更加高效。我认为,人工智能主要需要解决三类问题:一、医生没时间去做的事;二、医生需要工具辅助才能解决的事;三、简化成像流程,让其更加标准规范。标准化和规范化的好处在于,可以帮助医生更方便地找到需要的信息。从这个角度来说,AI确实可以帮助医生降低工作难度。
步宏:医学上有风险高低之分,风险低的任务可以交给机器完成,风险高的必须医生亲自处理。但对于风险低的任务必须做质控,比如机器筛除了90例患者,医生必须对这90例患者进行抽查。
李纯明:这同样有一个前提,AI要能判断风险的高低。但我前面已经说了,目前的AI还没有自我意识,它不能自我评价整个计算过程难易程度和输出结果的可靠性。它不会在输出结果的同时也同时输出一句话说“这个病例我处理得很纠结,我没有把握,还是交给医生来处理吧”。另外,什么样的抽查比例才是合适的,我认为这也值得思考。
唐立钧:我也简单谈谈。我们影像科出报告是必须双签的。一般来说,年制比较高的医生不用写报告,而是交给下面的住院医生和实习生写。他们把报告写好后我们再看一遍,如果没问题就签字,这就叫做双签。双签之后的报告就是正式文书了,具备法律效力。
我之前听过一个演讲,讲得很中肯。里面提到,AI发展成熟以后可以部分替代住院医生和实习生。比如由AI出报告,医生来复核,从而减轻医生的负担。
另外,临床上医生需要对病情有动态的观察。比如,病人第一次来医院检查,发现了小结节或者毛玻璃结节,医生一般会建议其三个月或者六个月后来复查。医生最烦看复查的片子了,因为病人虽然只做了一次检查,医生却要将其所有的历史检查结果都看一遍。假如AI可以自动将结节的影像与历史数据比较,分析密度、大小的变化,医生很容易就可以得出诊断结论。
再比如体验。以前都是用胸片体检,不怎么能发现病灶,现在都改成用高分辨率的薄层CT了,光肺部就有几百张薄层CT图像。医生检查的时候起码要看三四遍,否则就容易漏掉结节,工作量非常大。医生疲劳的时候也容易犯错,对结节熟视无睹。假如AI可以先把所有结节都圈出来,医生就轻松多了。雷锋网