浙大睿医人工智能研究中心吴福理：我眼中医疗人工智能的现状

AI 医疗睿医人工智能

作者：张栋

2017/10/31 00:06

浙大睿医人工智能研究中心吴福理：我眼中医疗人工智能的现状

资本大量涌入医疗人工智能领域，截至2017年8月份，根据亿欧智库的统计，国内医疗人工智能公司中有104家累积融资额已超过180亿人民币。

从这几个数字中也可看出当今医疗AI的火爆程度。那么在这个领域中到底什么才是最为关键的因素？医疗厂商、算法亦或是数据？

在近日由深圳市福田区人民政府指导，晶泰科技、腾讯主办，辉瑞制药、北京大学深圳研究院、科辉创新承办的2017人工智能＋医药健康创新峰会上，浙江大学睿医人工智能研究中心副主任吴福理谈了谈他的看法。

在吴福理看来，技术是提供给医生的工具，而非用来取代医生的。他认为AI最后的智慧会达到全人类整体的平均水平但不会超过人类，因为医疗是开放性问题，不像围棋属于封闭式问题。

除此之外，他还多次提到标准化数据的重要性。

吴福理表示，没有标准化的数据，AI就无从谈起。现阶段所有AI公司都在笼聚一些大型三甲医院，形成数据联盟。未来的医疗数据，尤其是临床数据，会像今天移动支付领域的数据一样，在大家使用后，国家会成立类似金融“网联”一样的医疗数据连接中心将这些数据聚集起来，并统一制定数据标准、标注标准，病种影像数据标准。

提及对医疗AI的展望，吴福理表示，关于服务医生、医院、用户端，所有的信息技术都会往云上走，往AI上靠。

如今，所有医院的信息系统都在升级，通过传感器收集更多病人数据。人工智能最终是想让患者了解自己，让医生更了解患者，让医疗过程更加精准，让第三方服务更科学，医疗管理更科学。所有公司都会朝这个方向发展，不限于APP或PC，不限于移动还是非移动，不限于云端还是终端。

随后，吴福理也谈到了睿医人工智能研究中心，他们的愿景是以人工智能为翼助力医疗服务，从检测的量化到诊断评估到干预治疗。

以下是吴福理现场演讲文稿，雷锋网做了不改变原意的修改与编辑：

我在浙大睿医人工智能研究中心任职，今天给大家分享下这几方面的经验：

第一是医学人工智能现状。
第二是医学人工智能展望，有哪些领域容易突破，计算机技术能辅助医生做些什么？这个领域到底哪些组成比较关键？
第三是谈谈浙大睿医人工智能研究中心的状况。

医学人工智能现状

从数据角度看，国家在这方面已有不少的布局和规划。关于人工智能的讨论，以“自动驾驶出了事故到底是谁负责”这一问题为例，国家已颁布了相关规范。那么在医疗人工智能领域，如果机器出了问题，到底是谁的责任？

医生？机器？医院？

人出错，人们往往可以能忍受，认为情有可原，但机器出错，很多人无法容忍。这其实是一个误解。

目前浙江省、福建、江西，已经有一定的标准去建立第三方影像中心。现在一个商用CT器械，如西门子的双源CT，拍一个人可以出2000张数据。而200张数据大概就200MB，如果一个医院一年数据达数十个TB，十个医院、一个城市的数据就是几个PB级，这么庞大的数据怎么分析？

如果有了足够的数据和明确规范，成立“国家队”机构也不无可能。

现在所有的AI公司都会笼聚一些大三甲医院，形成数据联盟。未来的医疗数据，尤其是临床的各种数据，会像今天移动支付领域的数据一样，在大家使用之后，国家会成立类似金融“网联”一样的医疗数据连接中心将这些数据聚集起来，形成数据标准、标注标准，病种影像数据标准。

我认为会朝这个方向发展。

如今大大小小的公司都在不同领域解决医生、医院各种各样的痛点。会看到计算机领域大量创业公司利用大量APP抢不同的入口：院内、院外或者病人健康数据、医疗健康、诊断、医药，再到平时跟老百姓直接相关的。这些APP更多服务于老百姓，服务于医生群体的反而比较少。

现在大家都在讲用人工智能、大数据解决医院的问题。但实际现状是相关技术及设备只在北上广深、沿海城市有所应用，在西部甚至有的三乙医院连信息化都没有完全做到，数据都没有标准化。

没有标准化的数据，怎么做大数据AI？举例说，大家听到最多的就是让AI阅片。一个病人拍了双源CT，200张到2000张的数据，医生开始看片子，看到有病灶，开始写报告并给病人。这个数据对AI公司一点作用都没有，因为并不知道是在哪一张图片上面有病灶。

这里我们就会发现，现在数据非常稀缺，稀缺到AI公司会去大三甲医院花费100元买一张带标注的数据，光买数据就要花上千万。在这形势下，创业公司怎么跟BAT竞争。

再者就是数据安全问题。医疗上80%是影像数据，而影像数据一个案例都有几百兆。大部分人都在讲云端处理，我个人更倾向于数据，计算机的AI学习在云端，而最后的推理一定是在终端。

关于AI的工具，慢慢偏向于终端发展。我觉得在医疗领域，终端比云端更重要，因为云端是学习推理能力，未来如果数据标准化，所有AI公司都拿到，标准级数据不再那么贵时，你在终端的推理能力可能变得更加重要。当然，在中国把这个做框架推导的，还没有这样的实力。硅谷已经把AI学习框架全部公开。现在相对来说算法是比较平了，尤其是在工程领域。

下面讲讲几个巨头在医疗人工智能上的进展：

IBM Watson大家很熟悉，它像一个搜索引擎，更多做文本分析，但并没有太多的结合对应的各种影像学数据和病理学数据。
Google在糖网方向做得比较好，他们有很多数据是花钱购入的。医疗门槛比较高，最近一段时间大部分创业公司或者BAT开始买医疗数据，或者以联合建实验室的方式变相买数据。
从国内来说，腾讯在医疗领域布局比较多，全国有三家互联网医疗方面的公司走得比较前面，这三家公司全都得到了腾讯的投资。

与他们合作的医院我都会关心有没有结合医疗流程。对于医生或者病人来说，我并不介意是不是AI为我看的病，对医生来说更介意的是会不会影响正常的医疗流程。大部分做影像AI公司都会另做一套系统，而医生平时每天用的系统在中国是被上百家小厂商(HIS厂商、EMR厂商、PACS/RIS厂商、集成系统厂商等等)控制的，。你可以想象这样的AI落地有多困难。对医生来说，不可能今天在医院用那个系统，突然跳到另外一个系统用AI再来阅片有没有毛病，告诉我提示什么，我再反过来用现在的系统。

医学人工智能的展望

关于服务医生、医院、用户端，所有的信息技术都往云上走，往AI上靠。所有医院的信息系统在升级，通过传感器收集更多病人的数据。人工智能最终是想患者了解自己、医生更清楚患者、让医疗过程更加精准、让第三方服务更科学、医疗管理更科学。所有的公司都是朝这个方向发展，不限于用APP或者什么技术，是移动还是非移动，云端还是终端。

想要做好这五点，每一点都要投入大量的工作，当你收集足够多的数据后，就会有用户画像。一个人一生的数据沉淀不是在一个医院，而是在一个城市，从你在一个城市出生，妇产科、儿科再到普通科室。这些云如果能以城市级别的信息收集，个人的健康数据会更加全，对AI更有作用。

大家谈到的医药，新药实验，医学知识图谱，人工智能辅助分析，眼科。把这些管理全部数据化，当有大量数据时就可以做很多工作，比如最典型的医保欺诈。如果我知道城市级别整个医保数据，通过数据挖掘和可视化的手段就可以探测到欺诈，可视化领域不仅仅有这个作用。当然，医疗是其中一个应用而已。

做辅助诊断，拿睿医来说，因为我们是一个隶属于浙江大学的科研机构，我们的研究更多偏向于解决问题来医生辅助，不追逐市场热点。所以说，在甲状腺、前列腺、宫颈癌、肺这方面和医院合作会比公司稍微有优势，因为我们和医院科研合作方面可以得到更加高质量的数据。有数据显示我国医疗影像诊断错误的比例，在某些地区和某些诊断领域高达35%，个别基层医院的误诊率甚至更高。AI能提升到50%就非常有意义，因为能提升基层医疗医生的医疗水平。

健康方面的检测，比如医疗保险，这都是跟学术相关的，不做详细解读。

睿医人工智能研究中心

我们的愿景是人工智能助力医疗服务。在几个领域都已做了一些工作，从检测的量化到诊断评估到干预治疗。

第一件需要做的事是标准化的工具。我可以提供一个标准化工具让医生标注哪儿的数据有问题。再过两个月之后成立一个数据联盟，联合一些大的医院，形成一个标准化规范化标注结果。虽然你在各种医疗AI大赛看到一些数据，但那些影像的数据对放射科医生来说没多大作用，因为标注太简单了。比如肺结节，下面分六种类型，如果计算机没有足够的六种类型的详细标注数据，现在的深度学习技术不能精确判断，那么医生还要重新看，AI的实际作用大大打折扣。

可以做AR/VR工具，增强病患沟通。也可以做免费问诊，这里做一些问诊匹配，已经做得相对还可以。在TOP1能达到30%多。这个结果对全科医生很有用。做精准匹配，对病人来说口述是什么，搜索相关医生或者科室给他推荐。在一级科室分类准确率比较低，二级科室TOP5已经可以使用。

关于眼底检测，做到四方面专利。眼底检测可以判断一般患者80%的慢性疾病。如果通过非侵入式的检查患者的眼底，通云端或终端设备判断给出建议，这个比一般的侵入式检查好很多。

视网膜病变，分辨率是90%，精确度已经达到75%。两年前我们做这件事的还不多，现在有不少公司在做。我们跟北京同仁医院合作了很久。

骨龄领域做了一些工作，骨龄是判断小孩发育成长快和慢的。如果这个小孩只有六岁，骨龄关节闭合程度达到7岁，就发育过快了。医生有一个图谱，收集大量图，会看两个图的对比。这个图谱是多少年来形成的，会有一定的误差，医生读片误差一般在一岁，而计算机误差在三个月以下。当然，有些科研数据已经精确到一个月了。有些领域是可以快速的做初筛，减少医生大量重复的劳动，整个提升医疗的水平。雷锋网雷锋网