资本大量涌入医疗人工智能领域,截至2017年8月份,根据亿欧智库的统计,国内医疗人工智能公司中有104家累积融资额已超过180亿人民币。
从这几个数字中也可看出当今医疗AI的火爆程度。那么在这个领域中到底什么才是最为关键的因素?医疗厂商、算法亦或是数据?
在近日由深圳市福田区人民政府指导,晶泰科技、腾讯主办,辉瑞制药、北京大学深圳研究院、科辉创新承办的2017人工智能+医药健康创新峰会上,浙江大学睿医人工智能研究中心副主任吴福理谈了谈他的看法。
在吴福理看来,技术是提供给医生的工具,而非用来取代医生的。他认为AI最后的智慧会达到全人类整体的平均水平但不会超过人类,因为医疗是开放性问题,不像围棋属于封闭式问题。
除此之外,他还多次提到标准化数据的重要性。
吴福理表示,没有标准化的数据,AI就无从谈起。现阶段所有AI公司都在笼聚一些大型三甲医院,形成数据联盟。未来的医疗数据,尤其是临床数据,会像今天移动支付领域的数据一样,在大家使用后,国家会成立类似金融“网联”一样的医疗数据连接中心将这些数据聚集起来,并统一制定数据标准、标注标准,病种影像数据标准。
提及对医疗AI的展望,吴福理表示,关于服务医生、医院、用户端,所有的信息技术都会往云上走,往AI上靠。
如今,所有医院的信息系统都在升级,通过传感器收集更多病人数据。人工智能最终是想让患者了解自己,让医生更了解患者,让医疗过程更加精准,让第三方服务更科学,医疗管理更科学。所有公司都会朝这个方向发展,不限于APP或PC,不限于移动还是非移动,不限于云端还是终端。
随后,吴福理也谈到了睿医人工智能研究中心,他们的愿景是以人工智能为翼助力医疗服务,从检测的量化到诊断评估到干预治疗。
以下是吴福理现场演讲文稿,雷锋网做了不改变原意的修改与编辑:
我在浙大睿医人工智能研究中心任职,今天给大家分享下这几方面的经验:
第一是医学人工智能现状。
第二是医学人工智能展望,有哪些领域容易突破,计算机技术能辅助医生做些什么?这个领域到底哪些组成比较关键?
第三是谈谈浙大睿医人工智能研究中心的状况。
从数据角度看,国家在这方面已有不少的布局和规划。关于人工智能的讨论,以“自动驾驶出了事故到底是谁负责”这一问题为例,国家已颁布了相关规范。那么在医疗人工智能领域,如果机器出了问题,到底是谁的责任?
医生?机器?医院?
人出错,人们往往可以能忍受,认为情有可原,但机器出错,很多人无法容忍。这其实是一个误解。
目前浙江省、福建、江西,已经有一定的标准去建立第三方影像中心。现在一个商用CT器械,如西门子的双源CT,拍一个人可以出2000张数据。而200张数据大概就200MB,如果一个医院一年数据达数十个TB,十个医院、一个城市的数据就是几个PB级,这么庞大的数据怎么分析?
如果有了足够的数据和明确规范,成立“国家队”机构也不无可能。
现在所有的AI公司都会笼聚一些大三甲医院,形成数据联盟。未来的医疗数据,尤其是临床的各种数据,会像今天移动支付领域的数据一样,在大家使用之后,国家会成立类似金融“网联”一样的医疗数据连接中心将这些数据聚集起来,形成数据标准、标注标准,病种影像数据标准。
我认为会朝这个方向发展。
如今大大小小的公司都在不同领域解决医生、医院各种各样的痛点。会看到计算机领域大量创业公司利用大量APP抢不同的入口:院内、院外或者病人健康数据、医疗健康、诊断、医药,再到平时跟老百姓直接相关的。这些APP更多服务于老百姓,服务于医生群体的反而比较少。
现在大家都在讲用人工智能、大数据解决医院的问题。但实际现状是相关技术及设备只在北上广深、沿海城市有所应用,在西部甚至有的三乙医院连信息化都没有完全做到,数据都没有标准化。
没有标准化的数据,怎么做大数据AI?举例说,大家听到最多的就是让AI阅片。一个病人拍了双源CT,200张到2000张的数据,医生开始看片子,看到有病灶,开始写报告并给病人。这个数据对AI公司一点作用都没有,因为并不知道是在哪一张图片上面有病灶。
这里我们就会发现,现在数据非常稀缺,稀缺到AI公司会去大三甲医院花费100元买一张带标注的数据,光买数据就要花上千万。在这形势下,创业公司怎么跟BAT竞争。
再者就是数据安全问题。医疗上80%是影像数据,而影像数据一个案例都有几百兆。大部分人都在讲云端处理,我个人更倾向于数据,计算机的AI学习在云端,而最后的推理一定是在终端。
关于AI的工具,慢慢偏向于终端发展。我觉得在医疗领域,终端比云端更重要,因为云端是学习推理能力,未来如果数据标准化,所有AI公司都拿到,标准级数据不再那么贵时,你在终端的推理能力可能变得更加重要。当然,在中国把这个做框架推导的,还没有这样的实力。硅谷已经把AI学习框架全部公开。现在相对来说算法是比较平了,尤其是在工程领域。
下面讲讲几个巨头在医疗人工智能上的进展:
IBM Watson大家很熟悉,它像一个搜索引擎,更多做文本分析,但并没有太多的结合对应的各种影像学数据和病理学数据。
Google在糖网方向做得比较好,他们有很多数据是花钱购入的。医疗门槛比较高,最近一段时间大部分创业公司或者BAT开始买医疗数据,或者以联合建实验室的方式变相买数据。
从国内来说,腾讯在医疗领域布局比较多,全国有三家互联网医疗方面的公司走得比较前面,这三家公司全都得到了腾讯的投资。
与他们合作的医院我都会关心有没有结合医疗流程。对于医生或者病人来说,我并不介意是不是AI为我看的病,对医生来说更介意的是会不会影响正常的医疗流程。大部分做影像AI公司都会另做一套系统,而医生平时每天用的系统在中国是被上百家小厂商(HIS厂商、EMR厂商、PACS/RIS厂商、集成系统厂商等等)控制的,。你可以想象这样的AI落地有多困难。对医生来说,不可能今天在医院用那个系统,突然跳到另外一个系统用AI再来阅片有没有毛病,告诉我提示什么,我再反过来用现在的系统。
关于服务医生、医院、用户端,所有的信息技术都往云上走,往AI上靠。所有医院的信息系统在升级,通过传感器收集更多病人的数据。人工智能最终是想患者了解自己、医生更清楚患者、让医疗过程更加精准、让第三方服务更科学、医疗管理更科学。所有的公司都是朝这个方向发展,不限于用APP或者什么技术,是移动还是非移动,云端还是终端。
想要做好这五点,每一点都要投入大量的工作,当你收集足够多的数据后,就会有用户画像。一个人一生的数据沉淀不是在一个医院,而是在一个城市,从你在一个城市出生,妇产科、儿科再到普通科室。这些云如果能以城市级别的信息收集,个人的健康数据会更加全,对AI更有作用。
大家谈到的医药,新药实验,医学知识图谱,人工智能辅助分析,眼科。把这些管理全部数据化,当有大量数据时就可以做很多工作,比如最典型的医保欺诈。如果我知道城市级别整个医保数据,通过数据挖掘和可视化的手段就可以探测到欺诈,可视化领域不仅仅有这个作用。当然,医疗是其中一个应用而已。
做辅助诊断,拿睿医来说,因为我们是一个隶属于浙江大学的科研机构,我们的研究更多偏向于解决问题来医生辅助,不追逐市场热点。所以说,在甲状腺、前列腺、宫颈癌、肺这方面和医院合作会比公司稍微有优势,因为我们和医院科研合作方面可以得到更加高质量的数据。有数据显示我国医疗影像诊断错误的比例,在某些地区和某些诊断领域高达35%,个别基层医院的误诊率甚至更高。AI能提升到50%就非常有意义,因为能提升基层医疗医生的医疗水平。
健康方面的检测,比如医疗保险,这都是跟学术相关的,不做详细解读。
我们的愿景是人工智能助力医疗服务。在几个领域都已做了一些工作,从检测的量化到诊断评估到干预治疗。
第一件需要做的事是标准化的工具。我可以提供一个标准化工具让医生标注哪儿的数据有问题。再过两个月之后成立一个数据联盟,联合一些大的医院,形成一个标准化规范化标注结果。虽然你在各种医疗AI大赛看到一些数据,但那些影像的数据对放射科医生来说没多大作用,因为标注太简单了。比如肺结节,下面分六种类型,如果计算机没有足够的六种类型的详细标注数据,现在的深度学习技术不能精确判断,那么医生还要重新看,AI的实际作用大大打折扣。
可以做AR/VR工具,增强病患沟通。也可以做免费问诊,这里做一些问诊匹配,已经做得相对还可以。在TOP1能达到30%多。这个结果对全科医生很有用。做精准匹配,对病人来说口述是什么,搜索相关医生或者科室给他推荐。在一级科室分类准确率比较低,二级科室TOP5已经可以使用。
关于眼底检测,做到四方面专利。眼底检测可以判断一般患者80%的慢性疾病。如果通过非侵入式的检查患者的眼底,通云端或终端设备判断给出建议,这个比一般的侵入式检查好很多。
视网膜病变,分辨率是90%,精确度已经达到75%。两年前我们做这件事的还不多,现在有不少公司在做。我们跟北京同仁医院合作了很久。
骨龄领域做了一些工作,骨龄是判断小孩发育成长快和慢的。如果这个小孩只有六岁,骨龄关节闭合程度达到7岁,就发育过快了。医生有一个图谱,收集大量图,会看两个图的对比。这个图谱是多少年来形成的,会有一定的误差,医生读片误差一般在一岁,而计算机误差在三个月以下。当然,有些科研数据已经精确到一个月了。有些领域是可以快速的做初筛,减少医生大量重复的劳动,整个提升医疗的水平。雷锋网雷锋网