近日,2018中国医学人工智能大会暨第一届人工智能雁栖高端论坛在中国科学院大学雁栖湖校区举行。来自全球的20多位专家学者、医生和产业界代表齐聚一堂,围绕人工智能+医疗、医学图像分析、机器学习等热点领域开展了历时两天的深入交流与探讨。
在第一天的大会会议日程中,上午的演讲嘉宾有:中国科学院院士、中国科学院大学副校长徐涛,中科院计算所副所长、IEEE Fellow、中国科学院大学副院长陈煕霖,香港科技大学计算机系教授、AAAI Fellow杨强,中国科学院院士、北京大学教授程和平,上海长征医院影像医学与核医学科主任刘士远,华西医院副院长龚启勇,清华大学终生教授廖宏恩。
上午会议由中国科学院计算所副研究员赵地主持。
其中,作为大会上午医学人工智能前沿环节的重量级嘉宾,刘士远教授向与会观众分享了题为“中国医学影像AI发展现状与思考”的精彩专题报告。
刘士远教授现任上海长征医院影像医学与核医学科主任,中华医学会放射学分会侯任主任委员,中国医学影像AI产学研用创新联盟理事长,从事医学影像临床工作长达32年,具有丰富的医教研工作经验。
刘士远教授
刘士远教授认为,医学影像将成为医学领域落地较快的一个方向,但是医疗AI影像产品目前也存在诸多难题,因此需要医生、学者专家、公司和政府通力合作,踏踏实实创新和实干,才能推动医疗人工智能行业的健康成长。
以下为刘士远教授的演讲内容,雷锋网AI掘金志经刘士远授权,作了不改变原意的编辑:
刘士远教授谈到,医疗影像行业有望成为较快落地的医学领域,有四个理由:首先,医学是一门靠逻辑归纳、经验学习和循证运用的学科;其次,各家医院都已经积累了海量数据,而深度学习的核心就在于“算法+数据”;而放射科的工作模式就是看图做诊断,便于深度学习AI技术的接入;在各类医疗数据里,放射类的医疗影像又是比较容易获取的类型,可以从这类数据入手来做标注并进行深度学习模型的搭建;根据相关统计,相对于逐年递增的巨大病人群,中国的影像医生存在巨大的需求缺口,这大大促进了影像AI产品的应用和商业化落地。
具体来说,医疗影像AI在临床环境中有很多的用途。比如疾病检出,AI能帮助医生提高早诊率,减少误诊率。这在肺癌筛查、骨折、AD、视网膜病变和病理诊断等领域都有实际应用的例子;还有医学多维测量,多维定量是精准医学的前提,影像AI在这块的应用有病变特征提取、病灶自动分割等;再者就是精准诊断,包括疾病的良恶性判断,精准分级和分期;AI在术前设计和疗效评估等领域也有巨大潜在应用空间。
实际应用层面,目前AI影像产品有很多,在胸部主要集中在肺结节检测和良恶性鉴别上,在神经系统上主要是脑出血检测和定量以AD预测,骨关节方面包括骨折和骨龄的检测,心血管方面则包括冠脉等相应产品的雏形,还有在视网膜病变和皮肤癌诊断等领域AI都有所作为。
就长海长征医院来说,医院已经实现了AI影像产品在肺结节筛查上的日常应用,肺结节良恶性模型还在研究当中,急诊的话还有脑出血和骨折模型产品,骨肿瘤模型也正在研究当中。
值得一提的是,在整个应用环节当中,上海长征医院对医疗数据是采取了很多的安全措施,实现了影像应用不出医院内网,产品有选择性的接收和发送数据,还会对数据进行自动脱敏和定时清理,很好的保护了病人的隐私信息。
上图是其产品的测试结果。可以明显的看到,在钙化结节,5mm以上磨玻璃结节,3-6mm的结节上,AI模型的表现超过了普通医师,而且人机结合以后也比只有医师的表现更好。
上图是其结节AI检测的实际应用场景,它会分析医疗影像并给出诊断报告,还有一键排序结节和一键测量结节等功能。
另外,上海长征医院的医疗影像AI还具备一个进阶功能,那就是判断结节的良恶性,不过还在研发当中。
人工智能现在非常火热,关于医生会不会被AI取代,刘士远教授也发表了自己的观点。
在原理层面,AI的大数据、记忆和计算能力会超过人类,但是神经网络发展的水平决定了机器不可能替代人类。在职业层面,人类的伦理、资质、表情和沟通等能力不会被机器取代。在技术层面,机器确实可以代替人类做重复性技术含量低的工作。
而且,现在的AI医疗产品也还存在很多问题。首先就是实用性差,比如,现在的影像AI产品大多是基于单病种图像标注形成的模型,尚没有符合临床实用场景的产品,而且大多数产品性能的自报数据与实际检测数据不符,鲁棒性有待提高。再加上AI产品往往只是集中在少数几个病种,难以覆盖全部医学影像问题。
在AI模型的研发阶段,数据也是一大难题。首先是现在普遍缺乏标准化高质量的训练数据,国内外虽然有很多公开的数据库,但是存在同质化和人种差异等问题。而且各家人工智能企业和机构采用的训练数据集标准多样,系统偏差较大,整个行业缺乏医学图像和疾病征像的统一认识。最后,整个行业的医疗数据保护和监管措施也是缺失的,数据不能被溯源,也就缺乏合法性和可分享性,还有就是伦理问题,业内缺乏对数据使用标准的判断依据,在现有的法律基础上寻找合规使用和分享数据的渠道,也是迫在眉睫的一件事情。
他建议到,要构建标准库,离不开医生的参与。要形成与AI研发相关的标准和数据,需要在图象的采集环节,标准库的构建环节,病种的分布以及各种描述术语等等都要达成一定的共识。
好消息是,国家在近期颁布了《国家健康医疗大数据标准、安全和服务管理办法(试行)》。
另外,在肺结节领域,中检院肺结节AI检验数据库标定专家组已经完成肺结节标准数据集建设。
图像标注环节也存在很多问题。以肺结节标注过程为例,主要存在以下问题,标注者队伍混乱,资质不一;图像征象认识不统一;图像标注方法不统一;图像分割方法不统一;图像量化方法不统一。
中检院在构建肺结节标准库的过程中,从全国招了250名5年以上经验的影像科医生志愿者,对他们进行了简单的测试,使用了30例结节,结果准确率只有30%,说明了如果没有共识和基础培训,医生的标注准确率是很低的,非影像科医生甚至不是医生的准确率就更难以想象了。还有就是标注的方式,有的使用紧密包裹法,有的使用区域标注法,有的使用其他方法等,不同的标注方法输出的结果也不尽相同。图像分割如果没有统一的标准,结论的差别也会非常巨大。还有量化的方法,到底是测直径,还是测体积,还是测质量,怎么测,都需要形成一致意见。
在医学影像AI模型检测阶段,也会存在生产过程不规范,模型效果和安全性缺乏公正评价,缺乏产品检测标准库和评价体系,缺乏相关法律法规、质控检查和管理制度等问题。
在AI模型使用阶段,受欢迎程度,对医生的影响,过多的假阳性,伦理和法规,是否匹配医院和医生的需求等问题也尚待解决。如上图,点击率代表病人对产品质量和准确性的信赖程度,越受欢迎,点击率越高;另外,产品该怎么和医疗流程整合也是一个问题,是游离于信息系统之外,还是融合于信息系统之内,都需要考虑;还有人担心年轻医生对AI产品产生依赖之后,会导致业务能力下降,包括看结节的能力;现在AI产品检出过多假阳性的结节还导致了焦虑和恐慌问题;还有伦理问题,包括数据的伦理和产品的伦理问题。数据的伦理就是数据的所有权、许可权和隐私权都需要制定规范,现在卫计委已经发布了相关标准和规范。第二个就是产品的伦理问题,随着产品的逐渐落地,产品的责任和影响都需要伦理的相关准则来考虑。
因此,医学影像AI模型的发展需要满足临床需求,既需要符合医疗流程,也需要符合临床场景,还要符合检查部位要求,还要能与医生、研究人员和企业进行协作配合。
作为一名医生,刘士远教授还强调,影像诊断是全链条、多维度的工作,工作内容不仅仅是图像识别,需要充分发挥医生在医学影像AI研发过程中的作用。
医生是医学影像AI产品研发的领导者,机器要做人类的助手,负责阅图、分析和判断等工作,而不是做竞争者。
反过来,医生也是医学影像AI模型的培育者和导师。在数据上,医生可以建立大样本的单病种数据库,提高训练数据质量,并在此基础上规范化标注,形成高质量训练集,还要学会在法律法规下分享和使用数据。
医生还应当成为质量控制和标准的制定者和执行者。比如制定图像采集和图像质量的标准,制定数据库建设的构成比例、病种分布、病灶类型等专家共识,并形成各单病种影像征象和描写属于以及单病种AI模型数据标记专家共识。
在AI伦理上,医生也是主角。医生可以建立一套正确的基本伦理准则来指导AI的设计、管理和实用。
最后,刘士远教授呼吁,AI现在还是一个尚不成熟的产品,需要医生去拥抱它,呵护它,引导它。当然也要避免另外一种情况,就是夸大宣传,夸大宣传容易误导政府和民众,不利于行业健康发展。
刘士远教授最后表示,虽然现在形势一片大好,但是医学问题其实是很复杂的,场景复杂,维度多,任务多,这需要我们医工结合,沉下心来,踏踏实实的创新和积累才能解决问题。
想了解更多CMAI大会的嘉宾精彩报告,请关注微信公众号“AI掘金志”的后续报道。
雷锋网雷锋网雷锋网