近日,国内首家人工智能实体医院正式成立,其AI系统学习了近百万张医学影像资料、53本专业医学教材、200万去标识化真实电子病历、40万医疗文献及病历报告。
而这背后的核心操刀人之一,便是陶晓东。
从GE Healthcare Research Manager,到飞利浦医疗放射解决方案首席架构师,再到科大讯飞智慧医疗事业部总经理,陶晓东几乎经历了影像方案从研究到落地的各个环节,深谙医疗AI浪潮之水的深浅。
访谈前,陶晓东博士打趣道:AI在国内大热后有个现象,CEO每对外吹一次牛,都得CTO花很多精力来填坑。为了不给工程师们添堵,今天我就有1说1,希望把最真实的科大讯飞智慧医疗事业部和医疗AI行业现状展现给大家。
以下是雷锋网与陶晓东的谈话内容:
雷锋网:您加盟科大讯飞后的这几个月主要在处理哪些事项?
这段时间更多还是把精力投入在战略梳理上面。
在医疗领域,其实科大讯飞还是一个新兵,所以我们首先要了解行业,然后发现并总结我们的优势,以及如何发挥这些优势。其次需要搞清楚哪些企业和机构是我们的真客户,这部分工作花了很多时间去梳理。
另一方面,我也花不少精力与产品团队沟通,把讯飞的医疗产品定义清楚。把产品定位和客户梳理顺畅后,再去思考什么样的产品对这些目标客户是有价值的。
雷锋网:梳理后得出的结论,现阶段哪类机构是你们的目标客户(受众)?
主要面向医院、政府、医生和病人。
从现在整个产品形态来看,直接受众主要还是医生,为他们提供一些辅助工具。
第二是医院,从信息化的角度出发,把医院信息整合起来,帮医院管理者更好地做决策。
第三是把小医院的项目做好后,后续可能会向两端延伸:一是政府,二是个人(病人)。
从政府角度讲,如区域卫生资源的配置,我们更多去跟医改的政策结合,用技术服务医改。
面向病人这端的产品,现在还没有想的特别清楚。为什么这么说呢?大家也都看到互联网医疗前段时间挺热,这些互联网医疗产品相对更 To C,但具体解决了多少问题,还有待商榷,所以我们的To C产品还处于摸索状态。
雷锋网:到时候向哪些机构收钱?
目前主要面向医院,所以现阶段的市场推广工作也蛮辛苦。医保这方面其实还没想法,但不排除和保险公司合作的可能性。
雷锋网:讯飞以往的医疗产品主要基于语音,如语音病例录入系统。而您则是影像出身,这个时候,您同时管理基于影像和语音这大技术分支的医疗项目团队时,会不会存在一些沟通和管理上的难题和阻碍?
语音是讯飞的第一个应用,也是第一个切入点。科大讯飞这么多年来被贴了一个非常大的标签:语音公司,所以过往的医疗产品也是基于语音来做。
我一直都在研究影像,其实不管是语音还是影像,我们的核心管理团队大多都是技术出身,再一步步做到管理。我们都非常了解底层技术、了解项目、了解产品,做过一定客户需求梳理后,又从上往下开始做管理。
从我自身角度讲,我现在已经很难再切入到技术底层去研究算法,而是更多关注语音或影像在医疗场景中现在能做什么?技术发展到了哪一步?关注客户需求,如何把语音和影像切入进去。如果从业务、场景、应用、客户层面做战略梳理的话,技术背景差异其实不会存在很明显的隔阂。
雷锋网:近期整个战略的优先级,是以影像为主还是以语音录入为主?
影像和语音产品,这两者对我来说都是手段,是工具,产品最终还是要解决临床、解决比较实质的问题。
现在医生的工作非常繁重,像三甲医院的医生每天要写很多文书,可能有30%的时间花在写各种各样的文档上。我们要做的就是如何用语音去帮助他提高效率。
而影像这边,很多医生每天大概要读150个片子难免有疏漏,我们要帮他们做辅助和预检。
这里其实有一个坑,做辅助诊疗如果准确率达不到100%,都有可能会增加医生的工作量,所以这也是摆在我们面前的一个挑战。现在影像产品得做成一个既能帮助医生,而且又很安全的应用,不能增加医生的风险。如果医生觉得机器存在一定的风险,理论上他就得审核机器看的所有片子,这时候辅助的意义也就成了伪命题。
从长期来讲,如何真正服务医生、服务病人,其创新逻辑分四种层面:
第一个是基于我的技术,我能做,所以我去做。
第二个是因为我能帮助医生,所以我去做。
第三个是因为我能帮助病人,所以我去做。
第三个是因为我能帮助社会,所以我去做。
雷锋网:就我个人推断,讯飞今年会在影像方向投入精力更多吧?
目前影像团队正在建。
影像还处于研究到产品的过程,至于团队构成,一部分是我们自己业务部门的团队,另一部分是讯飞研究院的团队,图像识别和医学这两类研究者都是必不可少的。
基于我过去在飞利浦的经验,很多医学知识我们是不具备的:临床医生、影像科医生和工程技术人员,这三者的“语言”实际上不通,各自又术业有专攻。
影像科的医生可能对另外两边都有些许认知,但他们毕竟是医生。
把大家整合在一起,让这些人充分理解为什么要做这件事情。因为很多时候,他们在解决的一个问题时,经过一系列研究后,最后发现根本不是用这种方式去做。
让三方“语言”互通,认知同步,是非常关键的一点。
雷锋网:你们先重点会从哪些点去突破?比如肺结节、眼底等。
肺结节是一个重要方向。
当然,这背后也引出了一个挺有意思的现象,市场上绝大多数初创影像公司都在做肺结节,大家都在说自己是90%、95%的准确率。
为什么都在做肺结节,实际上说明大家的创新能力还不够,其次是大家能够得到的资源都很相似,因为肺部CT是公开数据最多的。
对讯飞而言,一方面是孵化出一个能用的产品,发现一个能够帮助到医生的场景。另外一方便是把团队医学影像的能力提升起来,接下来主要会做像乳腺的钼靶、超声甲状腺结节、核磁图像分析等方面的研究,其中乳腺钼靶产品8月份已经在“智慧医院”投入试点应用。
雷锋网:刚您也提到之前在飞利浦工作,从器械商到人工智能公司做医疗业务,您个人经历了哪些转型?
首先从业务和研究的角度上来讲,转变其实并不是太大。
我在GE和飞利浦期间,在研究院与业务部门都工作过。所以我十分清楚大公司在做产品和做研究两方面有哪些不同。
在飞利浦担任总架构师时,其中一部分工作在做用户需求的梳理,以及解决方案的设计,这需要跟用户有着特别多的沟通。
基于这些经验,所以我也很熟悉团队中的销售、售前、产品、研发等环节,我知道他们需要做什么。
其中一个较为明显的转变,是因为国内外各种环境的差异所引发的系列问题。
加入讯飞是我第二次海归,虽然过去对国内医疗市场有所了解,但还是有很多东西要学,包括整个运营方式,工作方式等。
国内外智能医学影像行业有一点很不一样,美国很多前沿研究是医生自己在做,而在国内,因为医生实在太忙,做研究时间通常是晚上10点以后和周末,两地医生投入的精力不一样。
国内有一特色优势,我们有大量工程技术人员会支持医生做研究,这使得国内在一些研究方面更超前。
我觉得在医学影像研究方面,中国很有可能在短时间内会超过美国。不过换句话说,也不是超过不超过的问题,研究不是竞赛,最终的目的还是要解决问题,中国有中国的问题,美国有美国的问题。
雷锋网:企业在与医院、政府合作上,中美有哪些差异?
中美两地的侧重点有些不一样,美国现在把18%的GDP用在医疗上,如何降低成本对美国来说是非常大的挑战。
我去年在美国做的一个项目是帮助医院做管理改进,提高效率,让医院对自己有一个全景的认识:让他们知道哪些流程可以改进;哪些工作人员需要做什么样的培训;帮助它减少不必要的检查等。
而中国面临的是基层医生不足、家庭医生不足的问题。这种情况下,如何用信息化的手段去支撑分级诊疗和双向转诊,将来会是一大挑战。
另外一个问题是如何给基层医生一个智能化的工具?基层医生往往因为经验不足,使得自己只能做60分的事情。但如果给他一个比较好的工具,就可能做到80分。
解决这些大环境存在的问题,会是科大讯飞从更长期的战略方向。
雷锋网:你们是先从基层医院开始打,还是三甲医院?
目前更多以三甲医院为主。
基层医院比三甲医院多得多,基层医院的主客观环境更为复杂。而各个三甲医院的配置相比而言比较相似,医生经验也更加丰富,能提出一些非常棒的需求,提出的这些需求也可以反馈到我们的产品设计当中,以及技术开发的Roadmap里去。
但存在个问题,三甲医院有优秀的医生给产品提需求,那么基层医院影像产品的需求谁来提?基层医生可能受限于专业水平,而让三甲医院的医生往往不了解基层医院的具体情况。
所以如何平衡技术创新和模式创新,都需要仔细考虑。
雷锋网:现在应用在医院的产品,成熟度到了哪个阶段?
得看产品形态。
我们一部分产品已经被医院常态使用,也有科研合作、试用、商务谈判前的试用和商务之后的试用产品。
这些产品有的反馈较好,有些一般,也有个别产品医生被抱怨比较多。
当然,被抱怨也是好事,是我们持续改进产品的动力。
您举几个反馈好的、反馈一般和反馈较差的例子?
这其实与场景关系很大,产品体验不好,往往和我们选错了场景或者场景不成熟有关。
像我们最早做口腔科的语音病历录入,由于场景的特殊性,使得医生在治疗、诊断过程中没法动手去写病例,口述便成了一个刚需。
医生们过去做完诊断、治疗后,需要大概要花8-10分钟的时间去写病历,现在口述内容全部记录下来后,再通过语义理解去帮它做结构化。虽然机器整理出来的结果存在一些错误,但医生只花一两分钟时间修改就已足够。讯飞在跟北大口腔医院合作期间,效率提升还是挺明显的。
而对于使用效果欠佳的场景,我们还在持续梳理,其中门诊电子病历是一项。刚才我也讲到国家在推行“一患一医一诊室”,但其实很难做到。很多时候医生在门诊跟病人谈的同时,也要跟病人家属谈,甚至下一个病人也在场插话,这些事情都发生在3-5分钟内,既要管理病人的情绪,又要顾及家属的情况,在这种场景下,语音录入会比较困难,那么相关产品也挺难发挥出它的作用。
雷锋网:除了语音外,现在有推出哪些AI影像产品?
现在有几家医院在试用正式的影像产品,这些都属于SFDA3类的产品。
目前更多还处于用科研手段做一些简单的、医生认为合适的、不影响他们正常诊疗过程的一些产品。还有一些利用回顾性的历史数据,跟医生过去的诊断做比较。
市场上的近百家影像企业我不知道有多少家现在正在跟CFDA沟通,或者有多少家是有有质量认证。有质量认证后才可以去申请CFDA认证。
智能医学影像产品市场一下子变成了一个大的泡沫,泡沫起来后,实际上有很多不是专业的从业人员在里面。很多创业者对整个监管和流程并不熟悉,所以我也很想了解这里面到底有多少人已经做成功了。
我在GE中国期间,2011-2013年我职责的一部分就是负责中国这些产品的上市,上市之前要做临床实验,要到CFDA去申请认证,当时Cover了四五个项目。
雷锋网:给国内智能影像市场的成熟度打个分?
抛开“证儿”的问题,大概打70分左右。
至于为什么打70分,剩下的30分因为什么,我举几个例子说明:
首先场景定义是一个难题:技术人员对医学的理解还不够深刻,很多AI公司还没有真正切入到诊断治疗过程中,如果要真正切入进去的话,他们要做的事情,应该是在非常合适的场景去辅助医生,甚至解决临床问题。
其次从业者需要了解医疗环节有哪些规范、风险,要尽量规避这些风险。而且要注意一点,必须要满足医生的需求,而不是满足技术的需求。
另一方面,GE、西门子、飞利浦有那么大的成像设备市场,但它们的后处理工作站也仅仅几亿美元的规模。而这几亿美元的规模背后,各家都有几十个不同领域的App在支撑。一平均下来后发现,单个软件在全球也可能只有1000万的市场,这其实非常非常小。
到底是什么原因呢?我觉得第一是研发成本问题,其次是一些很小的应用可能在全球也就只有几千个用户,但因为竞品有,其他友商觉得我也必须要有,最终导致这样的循环。
从GE、西门子、飞利浦的角度来讲,它有影像设备的销售做支撑,所以它仍然可以养一支影像团队。而从我们这种没有影像设备的纯人工智能公司而言,不得不进行模式的创新,而不能完全跟它在这个领域拼。因为这个领域,GE、西门子和飞利浦已经做的很好,并且把能做的都做了。
雷锋网:您是如何评价今年智能影像突然这么火?是因为纯图像识别的赚不了钱,所以开始探索影像,还是其他?
我个人觉得,主要是因为最近open域的医学影像数据开始变多了。
之前只能从医院里拿数据,这非常难,即便现在从医院里面拿数据也极其困难。
现在各种各样公开的老年痴呆症、肺结节数据很多,中国也在做脑计划,里面有大量数据用在临床应用里,此外像kaggle等比赛里的数据也非常多。
开放数据的增多催生了这个行业,数据多了之后,算法和应用也在不断成熟,这个轮子转起来之后,逐渐形成了一个良性循环。
其实我做这么多年影像,很早之前还有过创业的想法,但一直都没走出来。(笑)
雷锋网:这里做个假设,假如您创业会选择哪个方向?
如果要做的话,可能会进入健康管理领域。但相比而言,健康管理的重点更多是对数据的采集,它非采集标准的数据,可能需要采集血糖、血压、生活习惯、食物、餐饮习惯等数据。针对慢病管理采集各种生活习惯的数据,还是比较困难的,挑战也比较多。
其实我之前也考虑过养老行业,但养老这个方向怎么讲呢,还挺让人沮丧的。
雷锋网:你们团队做影像研究,更倾向于用传统的机器学习方法,还是用深度神经网络、卷积神经网络这些新工具去做?
更多是卷积神经网络。
在方法上,有句谚语这样说的“如果你唯一的工具是一个锤子,那么你看什么东西都像钉子”,
现在大家都是拿着深度神经网络、卷积神经网络,到处找应用,讯飞也在这个阵营里。让我比较庆幸的是,在没有特别多医学经验的情况下,我们在很短的时间内实际上做到了相对比较好的表现。从这一情况来看,说明我们的人工智能算法已经有了一定的水平。
雷锋网:谈到锤子和钉子的问题,市场有一现状,有些公司冲着解决问题去,主要精力是先找好钉子。有些大公司人力财力比较雄厚,所以他们更多先去优化自己的AI工具,也就是磨炼锤子,然后等锤子做好后再去找钉子。目前科大讯飞是先以找钉子为主,还是以打造锤子为主?
这种现象确实存在,尤其是一两年前的AI圈,很多知名AI公司热衷事先建立算法壁垒,全力打造好锤子后再去找钉子。
但存在一个问题,有些业务技术壁垒高,而有些业务则是场景壁垒高,不同的业务得选择不同的打法去做。所以有时候在针对部分业务时,一条腿长、一条腿段短的走路方式确实有它的合理性。
但医疗行业属于技术壁垒和场景壁垒都比较高的项目,任何医疗AI公司走任意一个极端肯定有问题。
从场景上讲,医疗领域有哪些具体的问题是讯飞等公司能够解决的,现在还很难说,得继续探讨。但从讯飞的立场来看,比较饱和的业务我们肯定不会去碰。
从打磨工具角度讲,其实工具的定义和作用也在持续变化,不同的阶段,都需要我们不断从不同的场景中去定义和发现,哪些是算法缺口,哪些是专家缺口,哪些是数据缺口,根据缺口去针对性地解决问题。
对我们团队而言,在锤子和钉子两方面的协调上,我觉得更多还是在应用里面把工具用好就行。
雷锋网:有哪些业务你们不会做入?
首先成像我们肯定不会去做。
有一些与治疗结合非常紧密的,我们可以去进行辅助治疗,但单纯的治疗我们可能不会去做。
我们更多会做雪中送炭的项目,但这不是说锦上添花的事情我们就不做,锦上添花业务的市场和份额还蛮大,因为大部分专家都集中在“锦上”了。
雷锋网:我比较好奇一点,科大讯飞头牌竞争对手Nuance的医疗业务收入,占总收入50%左右,为什么讯飞医疗业务收入占比并不是很高。
Nuance的主要收入是语音病历转写。
实际上,美国医院一直有使用语音转写习惯,而且美国的电子病例普及率达到了47%,这其中有72%是用语音转写的。
属于国情的差别,现在美国完全可以做到一患一诊室,问诊过程可满足一对一,相对来讲比较安静。
而且由于政策要求,需要医生把病例写得非常完整,这就得花费很多时间。一个放射科的报告,往往要写三、四页。
电子病历越要求完整详细,语音转写的作用就越突出。
这为用户习惯的培养,创造了天然的土壤。
虽然国内电子病例国家也有规范和要求,但强制性并不高,与医生的很多绩效不直接挂钩,这就导致医生往往缺少使用语音转写的需求,用户习惯也较难养成。
语音转写在国内处于市场培育阶段,现在也有一些厂家在做,所以我们希望与它们一起把这个市场培育起来。
除此之外,我相信国家也会对电子病例的要求越来越严格,否则健康档案是不完整的。客观环境成熟后,会加快医生习惯的养成。
当然,这是个庞大的系统工程,需要比较漫长的过程。
更多关于人工智能升级传统行业的文章,请关注雷锋网AI商业化垂直微信公众号:AI掘金志。