近日,第六届全球人工智能与机器人大会(GAIR 2021)在深圳正式启幕,140余位产学领袖、30位Fellow聚首,从AI技术、产品、行业、人文、组织等维度切入,以理性分析与感性洞察为轴,共同攀登人工智能与数字化的浪潮之巅。
在医疗科技高峰论坛上,中山大学中山眼科中心的袁进教授从算法、数据、算力等角度,对目前的AI行业进行了剖析。他指出,算法或许是目前的短板所在。“不少团队使用的是第三方提供的算法模型。真正自己去做自研平台、训练算法的比例只有1.6%。用公开的方法不是不好,而是公开算法不一定满足自己特定化的需求,这也是为什么在算法上进行创新的原因。”
为了能够促进行业的规范化发展与落地应用,2018年,袁进教授牵头组建了全国第一个智能眼科学组。他表示,以前,我们讲的都是眼科人工智能。现在,要将其调整为智能眼科,以人工智能、5G、可穿戴设备、高清成像、新一代机器人等新时代的技术,融合到临床上应用,打造真正的智能眼科。
以下是袁进教授的演讲内容,雷峰网(公众号:雷峰网)做了不改变原意的编辑和整理
袁进:各位同道,大家下午好!非常高兴受到雷峰网的邀请,来参加这样一个跨专业、跨学科的交流,认识了新朋友,也见到很多老朋友。我会从专业知识的角度,来分享一下眼科人工智能的发展与挑战。
世界卫生组织曾写到,影响人类生存质量的三大疾病——肿瘤、心血管和眼科疾病。我的演讲中有几个关键词,一个是眼科,一个是AI(人工智能)。
AI不是一个新概念,上世纪60年代就已经诞生。为什么熬到现在才强势地C位出道?
根源在于2010年算法的突破,以及与实体场景的结合能力大大增强,带来了AI的井喷式发展。从本质上来说,AI主要是模仿人类思考问题和解决问题的能力。
在AI领域,中国是为数不多、能够与国际同行并跑或者领跑的学科领域。其他领域都在强调解决卡脖子问题。但是,在AI领域,我们已经是国际上非常重要的一个阵营,来自中国AI领域的论文数量和质量都很高。在这其中,眼科贡献了非常多。为什么是眼科,而不是心血管、骨科等其它的专科?
这里面有两个原因。
第一,眼睛是一个天然的光学器官,是以影像为主导的学科。所有的眼科诊疗都需要影像来介导。所以,眼科有大量丰富的影像资料,这就为AI系统的研发提供了必要的原材料。
第二,它有强烈的内在需求。中国有14亿人口,但是所有注册在案的眼科医生只有3.3万人,而且眼科医生还集中在一些大中型医院。
所以,每次说到医疗扶贫、优质医疗资源下沉,眼科总是被第一个拎出来,希望下沉到基层。这本身就是一个伪命题,什么叫优质的医疗资源?优质就是少,少还要让它“撒胡椒面”,显然是不可能的。
但这样一个命题,随着AI的出现有可能在将来得到解决。眼科人工智能的开发,是医学人工智能的缩影。我们碰到的问题,别人都碰到过,我们没有碰到的问题,别人可能也还会碰到。
一个好的人工智能系统,要有三个要素:算力、算法、数据。
算力倒不重要,主要是靠钱投入,购买一些计算性能好的GPU工作站搭起来,甚至借助中山大学的天河二号都能解决算力的问题。
但是,最重要的是数据,数据来源是哪里?
第一是和医院合作,得到脱敏数据,但是从医院拿数据,医院会考虑回报是什么,是科研文章还是产品共享?这会产生很多合作形式的问题。
第二是免费、公开数据集。现在有很多公开数据集,但是质量良莠不齐。其次,我们使用过Kaggle数据库,这是全球最大的免费眼底图像数据集。我们发现,它的错误率有15%到20%,这样的数据库训练出来的系统能到什么层次?
第三,用真金白银买,很多AI企业烧钱烧得很快,这也不是一个好的方式。
即便拿到了数据,还会有第二个问题——数据的清洗和标注。业内曾开玩笑说,人工智能,先有人工再有智能。要一群医生给数据打标签,费时费力,质量还可能良莠不齐。如何解决这个问题?
首先,要学会数据的清晰和分类。数据一定要人工标注吗?能否有智能的算法对数据进行归类,进行初步的特征提取,医生就不需要下场做“运动员”,而是做“裁判员”。
其次,要有公益心,开发出的AI产品愿不愿意贡献出来。国家也在强调,要建立规范的、经过严格论证标记的第三方数据库,用于产品的开发、验证。
所以,中山眼科中心自己花钱做了很多事,把自己做的金标眼底数据集面向全球进行公开免费的发布,命名为iChallenge。
目前,全球已经有2000多个团队利用这个公开数据集,开发了很多在临床上应用的人工智能算法系统。
同时,不仅仅是青光眼,我们团队还跟南方科技大学合作,做了从眼表、角膜这样一些病变损害特征的数据集,包括眼底的特征参数,都进行了公开和共享。
我们希望能够有更多的团队,利用这些金标的数据集去开发高质量的人工智能诊断系统,尽快进入医疗临床,改变现有的医疗模式。
同时,我们现在做的这些分割系统和算法也开始进入临床转化,因为仅仅是出于科研目的是远远不够的。总书记讲过,要把科技成果写在祖国的大地上,所以我们现在也在推行这些算法、系统的转化和应用。
这是我们团队开发的诊断眼科疾病——干眼的基于图像分割的算法系统,完成了成果转化。不仅是在中国,经过我们的授权后,国外也装入了这套系统,这也是国内为数不多被国外主流装备所采纳和应用的案例。
解决了数据问题后,第二个问题就是算法。
在算法层面,我们国家可能存在一定的短板。因为真正沉下心来做原创算法的团队和机构不多。不少团队使用的是第三方提供的算法模型。真正自己去做自研平台、训练算法的比例只有1.6%。
用公开的方法不是不好,而是公开算法不一定满足自己特定化的需求,这也是为什么在算法上进行创新的原因。
谷歌的Deepmind团队和英国的Moorfields眼科研究所开发出一个新算法,采取了并联的方式,去解决医疗应用上的黑箱问题。算法同时将疾病的分类和特征提取分开训练,最后进行结果的匹配。
还有近年来比较流行的迁移学习。开发出一个好的算法后,基于同类的影像特征,我们没有必要再把原来的路走一遍,可以通过迁移学习来完成新算法模型的开发。
这个例子就是他们原来做了肺部CT的短发,然后应用到眼科OCT,包括利用不同的热图的标记去展示算法读图的功能。
当然,人工智能算法也存在同质化的现象——开发一个模型只能解决一个病。
对于医生而言,可以一个人看数十种病,不然看一个病换一个医生,医生在病人面前就跟走马灯一样。
所以,我么希望AI算法从单模态、单任务转变为单模态的多任务。同样一张眼底图像,不仅仅是能诊断糖网,也能诊断青光眼、高度近视等不同眼底疾病。
这种想法在今年实现了突破:利用眼底图像训练后,AI可以对39种眼科疾病,包括全身性高血压的疾病进行诊断和预测。在这个过程中,要求算法的可视化和可解释性,这样才能使更多的临床医接受。
要做到这一点,就要使用不同的分类器去解决不同的特征。
另外一点,眼睛是心灵的窗户,可以反映心脑血管、代谢性疾病、糖尿病等早期的症状。我们团队做了一项工作:基于眼科的微血管的特征提取、智能参数的分析,去服务于代谢疾病(肾病和糖尿病等)的早期诊断。
除了单模态的多任务,进一步要实现的多模态、多任务。
在临床上,医生诊断一个疾病往往不会只依靠一种设备,仍然存在着漏诊或者误诊的风险。所以,把不同的诊断设备进行整合,形成多模态的人工智能诊断系统,将是未来趋势。
我们团队将眼底照相和OCT两种不同的诊断数据融合后,去诊断青光眼,进一步提升了诊断的效能。目前,实现了双模态、双任务,但是要真正实现多模态多任务,还要解决设备在空间和时间上的融合和交叉问题,否则影像特征难以准确匹配。
现在,我们把眼科的几个重要诊断设备,如OCT、裂隙灯、眼底照相数据集成,正在进行系统开发,硬件也即将进入开发阶段。
虽然多模态进入临床还要一段时间,但是双模态这种搭载智能诊断系统的装备已经进入到临床,这是把眼底照相和OCT两个不同的模态影像进行融合,在临床上对眼科疾病进行诊断。
将来,算法会如何发展?
我们看到一个有意思的研究:用人工智能的方法,去计算一个抛出物体在空间的运动轨迹和落地点。
传统算法的工作量会非常大。但是,从物理学的先验知识角度来看,如果没有外界干扰,遵循简单的抛物线原理,就能完成算法系统的开发。
因此,我们要抛弃单纯由医生贴标签的过程,把文本、逻辑等先验知识结合起来,进行新一代人工智能算法系统的开发。
同时,系统本身还要进行自我进化,也就是遗传算法。被公众所熟知的人工智能标志事件是,AlphaGo打败了人类最顶尖的棋手。后来,Alpha Zero不用学棋谱,只学里面的逻辑概念、判定胜负的原则,它自己进行逻辑的归纳,就能完成算法的提升。最后,它又打败了AlphaGo。
未来,算法要体现自我提升的能力,才不会局限于人类自身的逻辑思维,也就是“超智能”、“超脑”的概念。
走到这里,人工智能系统只是走完了开发阶段,很多系统会倒在最后一公里——真实世界研究。换句话说,你的模型、算法框架可以做的很好,但是到了临床上,能否依然保持高水准。
如果达不到,一定会被市场抛弃和淘汰。
如何去做真实世界研究?要有规范。这个规范没有答案,也没有参照物。既然没有,我们就要自己做。
首先,我们要有一个团体。2018年,我牵头组建了全国第一个智能眼科学组。
这是一个跨学科的组织,包括97个眼科机构、全国排名前20的眼科机构、研究机构,中科院图像所、中科院计算所、头部AI企业、BAT都加入了这个组织。依托这个组织,我们制定了全球第一个针对眼底照相的人工智能筛查、临床应用指南,为人工智能诊断系统的真实世界研究提供了一个范本。
这份指南是中英文同时发布,英文版在发布不到三个月的时间里,被国际顶刊转发超过7万次。指南也和智能医学专委会,包括眼科学会和医师学会等三大学会共同见证,推广在临床的使用。
基于指南的要求,两个医疗AI公司硅基智能、鹰瞳科技在2020年陆续得到NMPA的三类器械批准,这两个团队都是来自我们的眼科中心,硅基就是和我们这个团队合作。
除了指南,我们也在进行行业规范化发展。
2019年,我们举办了第一个眼科的人工智能专刊,向眼科医生推广人工智能的理论问题。去年,我们也主办了第一个智能装备的专刊,介绍智能装备研发的最新动态。
今年,我们又受《人工智能》编辑部的委托,举办了智能医疗的专刊,进一步展示人工智能未来发展的前景。同时,我们完成了人工智能在眼底彩照标注领域的第一个团体标准,使大家以后在系统的开发上更加有规章可循。
人工智能在医疗领域是全链条、全生态的覆盖。
以前,我们讲的都是眼科人工智能。现在,把这个词进行了微调——智能眼科,是以人工智能、5G、可穿戴设备、高清成像、新一代机器人等新时代的技术,融合到临床上应用,打造真正的智能眼科,而不仅仅局限于眼科人工智能这样的概念。
目前,我们正在与深睿医疗合作,由我牵头推进的一个全天候、多场景、交互式的视觉功能导航系统,将工智能的场景识别,包括智能汽车导航的识别方法,对新的元器件进行整合,打造一个对低视力和盲人的智能视力辅助系统,从而改变他们的生活状态,提升生存质量。
最后,中国眼科人工智能的发展任重而道远。
国家已经提出了明确的目标,2025年成为人工智能强国,2030年要成为世界主要的人工智能创新中心,要实现这样一个看起来已经非常近的重大目标,需要医疗专家、理工科技术专家、企业共同携手。所以,我们的理念是“齐携手、共努力、期未来”。