作者 | 李雨晨
编辑 | 王亚峰
作为《巨头的医疗软肋·五问》的系列选题之四,沃森肿瘤(Watson for Oncology)是该系列中光环最大、运营时间最长,同时也是争议最多的巨头产物。从诞生以来,围绕沃森肿瘤的话题就从未停止。今年2月,沃森健康(Watson Health)被传出售。对于这一传闻,沃森健康一位前员工康明(化名)证实道:沃森没有被出售,原来的同事还在正常上班。但他也表示,“沃森被IBM单独拆分、成立公司上市的可能性是有的。”而据雷峰网了解到的最新消息,沃森健康最知名的“代表作”——沃森肿瘤在中国大陆已经停止销售,原先的客户也无法继续使用沃森肿瘤产品。但是,沃森的临床试验(IBM Clinical Develop)以及药品知识库产品(Micromedex)还继续在中国市场推广。这意味着,IBM内部为期十年的“登月计划”正式搁浅。沃森肿瘤为何会败走中国?复盘沃森健康的过程中,我们与沃森的前员工、知情人士、合作方以及多位美国的医疗AI学者进行了探讨,发现了很多意外的信息,如沃森在舆论上的被动、空降领导的失败、利益牵扯下的落地难题等。同时,在该系列选题上,我们为巨头的挫败寻找到了一些共性:战略失策、文化冲突以及企业的固有基因。这些共性的背后,核心要素是“个人”与“群体”的思维及利益冲突。事在人为。沃森肿瘤的挫败不是一次群体智慧的失败,而是一首人因的悲歌。
在一众媒体的报道中,沃森是一个精于营销、喜欢夸大的形象。但是,在与康明对话时,我们得到了一个截然相反的结论:IBM从来没有主动为沃森做过品牌营销。康明强调,这也是自己发声的原因。他表示,目前能看到的所有宣传和营销,IBM都没有背后支持。美国总部对沃森的定位是增强智能,而不是人工智能,尽管翻译过来都是AI,但是差别巨大。2018年是沃森的多事之秋,多个案例直指沃森的建议疗法“不安全、不正确”。最“著名”的一个病例,是沃森为一位有出血倾向的结肠癌患者,推荐使用联合安维汀方案的化疗,而安维汀是血管生成抑制剂,容易引起出血。康明强调,这一情况是在内部的测试环境中出现,却被别有用心的工程师泄露出去。而测试与正式版本上线之间,仍然有很多的内部测试工作去修正,这个案例显然不能成为众人指责的依据。恶意传播,让沃森肿瘤内部的同事非常窝火,希望公司站出来澄清。而出乎所有人的意料,总部定下的策略是“不回应,任舆论自身自灭”。(高管的唯一一次对外发声,是全球高级副总裁John Kelly在《华尔街日报》刊登文章,对媒体提出的唱衰Watson的问题逐一反驳)在绝大数局外人看来,不回应就是某种意义上的默认,这种策略在很大程度上反噬了沃森的品牌形象。不能进行舆论救火,IBM Watson健康中国市场部非常被动,大部分工作只能做一些展会支持,这让员工有些挫败。甚至有一次,沃森肿瘤的代理商百洋智能还找上门,希望自己能代为发声,得到的回应仍然是“不”。《浪潮之巅》中写到,从IBM的客户基因来说,不管是在老沃森执掌的机械时代,还是在小沃森接管的电子时代,IBM的客户群基本上是政府部门、军方、银行、大企业和科研院所。康明表示,“自从卖掉PC等C端产品后,在总部的眼中,做to B生意更注重与专业客户的沟通。在消费者端或者自媒体端的PR,总部没有太多经验,也不看重关系的维护。”或许IBM领导层认为,自己只要对董事会和公司营收负责,对每一个不实消息都进行回应,是自降身份。沃森肿瘤另一个出名的“败笔”是2017年2月,运营M.D.安德森中心的德克萨斯大学宣布关闭与IBM的合作项目,为合同上最初价值240万美元的项目向IBM支付高达3900万美元的赔款。德克萨斯大学的一项审计报告指出,与IBM合作的这个项目已经花费了M.D.安德森超过6200万美元的成本,但仍然没能实现既定目标。实际上,6200万美元的金额,已经远不是部署一个沃森系统那么简单。康明表示,沃森在研发初期有两套思路:一种是Saas服务(与纪念斯隆凯特琳癌症中心合作,目前全球推广的产品),一种是私有化定制开发,也就是与M.D.安德森合作。而这项合作之所以成本这么高,是低估了医院院内系统改造和医疗数据的复杂性。在很多人的印象中,美国已经是一个医疗IT基础设施非常好的国家,合作双方也是这么想的:医生只要录入患者的信息,沃森肿瘤即可给出标准方案,在HIS统内直接生成。但是,当IBM的工程师到M.D.安德森现场调研后,发现这一与HIS系统深度整合的构想基本不可能实现,很多院内数据完全不可用,互联互通更是不可实现。最后的结论是:要整合沃森肿瘤的能力,需要帮助医院重新做一套全新的HIS系统。那么,这一套“推倒重来”的系统需要多少钱?一个参考数据是,目前国内南方省份某顶级医院新建医院院区的信息化项目包已达数亿的金额。所以,M.D.安德森最初合同的240万美元,根本无法支持这一计划。另一方面,与M.D.安德森合作的项目之所以停止,还因为当时主推该项目的院长被弹劾(据消息显示是院长的夫人触及了审计问题)。领导人下台,项目自然难以继续推行。但是,在一些媒体的报道中,将项目失败的原因全部归于沃森肿瘤,这也是康明认为被严重误解的一件事情。在市场传播及对外合作中,沃森似乎是一个“被动者”的形象。但与其他几位专家沟通时,雷峰网得到了不一样的反馈。一位身处美国的医疗AI学者少刚质疑道:“如果IBM在答应做这个事情之前,对美国医院的通用信息系统不了解到这个程度,也是从这个角度说明其专业程度不高的。他们跟做项目难道不理解医院里的基本IT系统?难道M.D.安德森的医生还需要告诉他们临床指南是什么吗?”对于AI产品的安全性和使用风险,他也提出质疑:“这样的产品如果在美国销售,绝对是要向FDA申请c认证,至少510K批准。但是,目前为止,似乎没有听到这个消息,这是匪夷所思的。推荐医疗治疗方案的产品的安全性和有效性要求程度,应该比做医疗诊断的产品功能要求更高的。FDA怎可能袖手旁观?当然,沃森在美国应该没有直接商业化。”一名与沃森有过合作的药企员工徐楠,与少刚的观点类似:“合作的责任不能都推给M.D.安德森和MSK。沃森的肿瘤系统本来是一个研究项目,就不应该作为成熟产品去卖。当然,这也能看出双方的沟通问题——部署以后发现那么多问题,为什么之前和M.D.安德森没有交流清楚?”
暂且抛开那些缠身的负面舆论,沃森在中国是有“蜜月期”的。2016年,沃森健康正式入华,首批合作的中国医院达到21家。在中关村软件园的IBM中国客户中心,时任IBM大中华区副总裁、战略部总经理郭继军"风光地"宣布了这一消息。在员工们看来,沃森入华,是看到中国整体的肿瘤治疗“非常不规范”。沃森曾委托咨询公司进行了调研:在东北的一些区域,医生给肿瘤患者的治疗方案与标准指南比,只有30%的一致性。换句话说,只有30%的人是接受了指南规范化的治疗。为了在中国更好地开展业务,沃森健康接连牵手杭州认知、青岛百洋两位合作伙伴。2018年,沃森肿瘤已经在中国22个省、43个城市的近80家医院落地。康明表示,当时大中华区基本占了沃森健康一个季度一半的营收,工作受到重视,大家都很兴奋。但是,政策的不确定性成为了一块“多米诺骨牌”——大国博弈影响了沃森进驻医院的进程。明显的变化出现在2018年:上半年情况尚可,到了下半年和2019年,媒体的负面报道和不断变化的中美关系,让医院对引入沃森心存顾虑,毕竟沃森产品线的服务器在国外。肿瘤产品是沃森第一批引入中国的产品,受制于政策,后续的影像类等产品线无法引入。这在无形之中,进一步加大落地的进度和难度。在本土化问题上,其实还有一个没有想到的“拦路虎”,那就是沃森肿瘤的老师——MSKCC(纪念斯隆凯特琳癌症中心)。在康明的眼中,这个世界上最古老和最顶级的癌症中心有着十足的强势心理。在沃森的本土化过程中,一些中国医生希望在版本中加入一些需求和模块,但是MSKCC却明确表示拒绝:“我们有自己的原则,如果沃森肿瘤要加入一些本地化治疗方案,就不要再以我们来冠名系统。”康明理解MSKCC坚持的理由,因为要顾及口碑。“有些中国医生提出加上中医的模块,MSKCC不懂中医,又要搭上自己的品牌,他们肯定不愿意。”但是,MSKCC的强势地位,给产品开发和推广带来掣肘。有一位用户表示,当沃森给出的治疗方案与临床指南和用户认知不相符时,沃森团队会与MSKCC沟通。但得到的回复是“这是我们的最佳临床实践,是优于NCCN(美国国家综合癌症网络)的”。MSKCC的执拗甚至是傲慢,让用户有些恼火。实际上,在肿瘤治疗最前沿的领域,例如免疫治疗,MSKCC态度依然如此:“我们中心进行着全球最先进的新药临床试验,等结果发布,用户就能明白我们使用这些方案的理由。”尽管MSKCC会牵头癌症治疗方案指南的编写,它一些方案事后也被理解和认同。但是在此之前,沃森肿瘤想要说服“讲究证据”的医生相信系统的结果,就会很难。说服不了客户、摆平不了合作伙伴,沃森健康的员工夹在中间,两头都不容易讨好。一位医疗AI人士就说到,“你想想,如果医疗AI公司能与中国的协和合作,敢说‘不’字吗?抱医院的大腿还来不及。”所以,在一系列因素的影响下,沃森肿瘤的落地和商业化并不顺利。有媒体报道,沃森健康传出大幅度裁员消息,随后,部门负责人Deborah DiSanzo宣布离职。但知情人士表示,“很多自媒体报道沃森健康大裁员,纯属无稽之谈,其实是收购后的部门进行了裁员,被裁员工吐槽裁了70%,自媒体演绎成了沃森健康裁员70%,这是不负责任的。”康明说到,"是DiSanzo这位老板没有把业务带起来,《华尔街日报》刊文质疑沃森盈利前景,逼得John Kelly亲自出面回应,这是导致DiSanzo下台的重要原因。但这也没什么稀奇,一个“跛脚”的领导,从传统的器械公司飞利浦跳槽后,领导一个新兴的业务,没有完成好商业目标,仅此而已。"
Deborah DiSanzo是何人?她做了3年多的沃森健康全球总经理。2014年,她卸任飞利浦医疗保健部门副总裁和CEO。2015年9月走马上任后,在40个月的IBM生涯中,她一手操盘了沃森的研发、外部并购等重大事宜。
Deborah DiSanzo据报道,当时IBM花费约40亿美元收购了4家医疗领域数据驱动型公司。2016年,成立仅两年的沃森健康,员工规模达到了7000人左右。跟随Deborah DiSanzo的,有一批飞利浦的旧部,来到IBM后大多负责售前的市场工作。相比于现东家,这些飞利浦系员工的思维相对激进,营收和市场推广策略的制定相对激进,而IBM本土的人则相对保守,喜欢思后而动。康明表示,"DiSanzo被人诟病的一点,是让沃森健康变得不像IBM的部门,非常浮夸。而她本人也善于鼓舞人心,在很多员工大会上只会分享好消息。"这也能从一定程度解释,为何IBM总部一直有意限制沃森的宣传,而客户或者合作伙伴还会认为"沃森善于营销"。更为关键的一点是,飞利浦是一家医疗设备公司,更加擅长医疗成像技术,而沃森健康应用的是认知科学AI,核心是自然语言处理、大数据挖掘、计算机视觉等技术。所以,两者之间就存在天然的界限,DiSanzo和手下在组建团队自然也会受到知识背景的影响。雷峰网了解到的一个旧闻是,2017年,时任IBM副总裁、沃森健康影像部门总经理的Anne Le Grand 在SPIE Medical Imaging(医学影像)的会议上做报告。有人提问,系统使用时出现医疗纠纷如何应对,她的回答是“IBM有很好的律师团队。”当时参会的一名专家极为震惊:“即便她没有理解这个问题是讨论IBM或者系统使用方的责任归属。但也不能在这个问题上,显露一种大公司的强权姿态,没有对病人生命的尊重。”2015年11月,IBM任命Kyu Rhee为沃森健康新的首席医疗官。在加入沃森之前,Rhee在卫生资源和服务管理局以及美国国立卫生研究院担任高级职位。这距离沃森健康独立仅仅过去半年多时间,可以说是沃森研发的关键期。Rhee确实是一名医学博士,但是职业生涯侧重行政管理。对于沃森肿瘤产品,能真正给出专业的指导意见吗?诚如康明所言,新领导的来临,没有为沃森带来好的结果,也没有为这位总经理延续一段成功的职业生涯。
除了政策的不确定性、领导团队的激进,沃森在中国推广不顺的原因,实际上还有很多人性和利益的因素。雷峰网获悉一位代理商的亲身经历:一家医院的院长想引入沃森,进一步规范医院的肿瘤诊疗行为,但是却遭到了科室主任们的反对。这让代理商想到了十年前的HIS系统:“当时,HIS系统进医院最大的挑战来自药房,因为它规范了药品进出库的流程,提升了药品流程的透明程度和可追溯性。沃森的情况和HIS系统很像,触及到某些利益问题。要知道,原先肿瘤药的回扣不小。”康明也表示,对肿瘤治疗的“随意性”,让一些医生没有使用沃森的动力。“只要治疗方案没有对患者造成严重后果,医生就很难被挑战治疗的合理性。一些医生和药企有利益关联,形成一套指南之外的治疗理念后,很难被推翻。”第二点、如上文所说,沃森肿瘤入华的重要原因是肿瘤治疗不规范。但是,国内医生的心态往往分为三种:接纳、观望和鄙视。康明认为,中国的医疗体系中,存在一些“山头”,例如,肿瘤专科医院的顶级医生在学术研究和临床实践上,放眼国际也拥有很强的话语权。这些专家会“屈尊”接受AI的指导?另一个极端,一些能力较弱的医生则是一种“害怕被替代”的心理,转化在行动上,就是“逢沃森的负面必转发”。有意思的一点是,不知是否受到了沃森的启发,中国临床肿瘤协会(CSCO)在专家的主导下推出了本地化版本的针对乳腺癌的AI产品......第三点,沃森提供的是SaaS服务。有媒体提到,沃森与医院的电子病历系统无法深度整合。国外的电子病历只有Epic Systems和Cerner两家,国内供应商则是数百家,整合难度更大。而且,沃森肿瘤在实际使用中需要医生手工录入数据,而临床医生实在太忙,不愿意挤出几分钟的时间去录入,这就导致沃森肿瘤很难嵌入医生真正的工作流程中。最后,在一些医生看来,沃森肿瘤只是更快地给出标准的治疗建议。美国多家癌症中心的医生抱怨,结果并不总是准确;但当结果准确时,系统也只是会提供肿瘤学家已经知道的信息。所以,一两位行业人士向雷峰网表示,在行业会议或者权威专业临床期刊上发表文章,是使用AI产品最优先的驱动力。至于临床的帮助,至少经过同行审议peer-reviewed的结果再说。实际上,沃森商业化的困境在于寻找到合适的付费方。美国医院在乎自身的治疗口碑,所以会付费。而在中国,患者更愿意为手术和药品买单,认为出方案应该是免费的,中国的医院也更在意收入和患者数量,这就导致医院不太愿意为提升治疗规范性的沃森肿瘤掏钱。种种医生和患者的"人性问题"和"思维惯性",为沃森的入华之路增设了更多阻碍。
站在康明的角度来看,尽管他是沃森健康的前员工、认为沃森遭受了很多误解。但是,他也认为,沃森健康的失败,是策略和研发上的失误。他认为,IBM是一个"工程师文化"为主的公司。这种文化体现在沃森的开发过程中:先做出产品,再进行推广,与如今"用锤子找钉子"的一些AI公司有些类似。据康明表示,沃森的产品从2014年开始做,产品开发早期并没有非常多专业医疗人士加入公司内部。3年后,产品定型时再引入医学背景的人已为时已晚。"这种工程师文化,应为后面沃森健康产品的商业化推广受挫负责,整个思路有点像大型机的研发策略。"据雷峰网查验,沃森医疗影像部门副总裁兼总经理Alok Gupta是在2017年2月入职。在与药企员工徐楠(化名)的沟通过程中,他表示,"沃森以前做医学影像方面的人非常少。做产品的经验比较有限。应该是Alok Gupta入职以后才组建这方面的团队。”但是,医疗AI学者少刚对Alok Gupta的评价却不高:“他是被西门子淘汰掉的,他主导收购了以色列一家研究乳腺癌的技术公司。这家公司后来两次没有拿到FDA的认证,但是,又签了对西门子很不利的协议。结果业务黄了,钱还打了水漂。”徐楠是美国一家药企的员工,多年前和沃森有过一些合作。他对IBM的评价不高:IBM的心思不在于帮药厂解决问题,而是做自己觉得有意思的事情。多年前,徐楠参观过沃森研究所的一些和医学影像相关的工作。他表示,IBM做的展示非常漂亮,但是在模型验证方面做的有限。这些成果可以发文章、可以做报告,但很难有实际运用。徐楠说到,在现今的研究环境下,很多人会"言必及深度学习"。如果出发点是人工智能,而不是解决问题,经常会出现大炮打蚊子的问题。比如用眼底图像预测体重血压,可能是个很有意思的研究问题,在具体应用中就没有实际意义。因为,传统的方法可以做得既快又准还便宜。在他看来,IBM不缺有能力的人,但是这些人不一定有话语权、有资源做事情。"不同背景领导看问题的侧重点不一样,汇报的必须是上级感兴趣的东西。所以,不只是IBM,其他科技公司做医疗也是同样的问题。如果解决方案里没有AI,就没法宣传、发文章。所以,侧重点经常是AI,而不是解决问题,很多公司更是把AI做嘘头。往往把AI喊得响的公司,可能越没有底气。"但是,对于“工程师文化”的观点,一位知情人士提出了异议。知情人士表示,“沃森不是工程师文化下的产物,一定是产品部门与MSKCC合作。而MSKCC是一个强势方,产品开发过程中,不是沃森的工程师不愿意干,而是MSKCC不愿意干,跟IBM是否是‘工程师文化’没有关系。”知情人士认为,所有公司面临的一个问题是,技术部门和医疗部门如何配合。软件工程有一套体系,IBM在遵循这套体系时,会对需求进行反复比较,不会无休止地满足客户需求,因为客户的需求不一定是对的。"互联网公司的打法非常快,但是版本控制非常糟糕,1000家医院有1000个版本。所以,你可以说沃森的效率低,但这是软件开发必走的完整流程。"
从"保守对待负面舆论"、"对项目合作难度的低估"、"触及医生的利益或尊严",在人因上,沃森遇到了不少挫折。当然,并不是说沃森本身没有问题,沃森被曝出的诸多医疗问题折射的是它"原生性"的短板——认知科学不成熟。具体而言,沃森的问题集中在了两点:癌症治疗方案的"个性化"和"标准化"之争、以及自然语言处理技术与临床应用价值之争。人类对肿瘤漫长的认知过程中,逐渐意识到,肿瘤不是一种疾病,而是一类疾病。对应到每一位病患,相同部位的肿瘤病理特征却完全不同。做出正确的诊断和提供合适的治疗方案,需要以病理学为标准,以影像组学、蛋白组学、微生物组学、基因组学等为辅助,这是一种多中心联动的、综合海量数据的决策。此前,《第一财经》的一份报道中写到,在癌症治疗领域,不同病人之间有十分微妙的差异,医生们需要有更好的方法了解和区分这些差异,因为这些小差异带来的影响,有时候可能是致命的。无法准确知道这些差异的结果,就使医生无法针对每个人不同的病情确定最佳治疗方法。“化疗是常见的一种治疗方法,”MSKCC的一位临床肿瘤医师Kris解释道,“但是你怎么在数十种不同的化疗选项中进行挑选呢?你又如何确定剂量?怎样的化疗频率才是最佳的呢?”所以,少刚认为,癌症的治疗一定是“个性化”的。他认为,“医生非常擅长做复杂的抽象推理判断,这是目前机器学习无法做到的。据我了解,沃森仅仅从MSKCC那里拿到了600例数据,所以,它提供的只是很浅显的统计信息,而癌症需要极其个性化的方案,需要综合患者的多维度信息,例如影像学上的参考——与周围血管的关系、肿瘤位置、大小、性质,有没有淋巴扩散,有没有远端转移,单靠统计信息没有太多意义。”“肿瘤是按照TNM分区,但是很多细节需要个性化治疗,并不是说所有T3的病人治疗方案是一样的。IBM的员工连这个都不懂,就在强力推销标准化,这个就是草菅人命。”在少刚看来,CDSS的产品本就不好做。全科医生要从病人的症状去推病因,这个过程不是一对一的映射,存在多病同像、一病异像的情况。CDSS是通过自然语言处理还有其他技术来做知识图谱,但是知识图谱会有错误、歧义和不确定性。中国医生的一线诊断错误率比较高,但不是一个CDSS就能搞定的。而问题的根源就在于,沃森的员工不懂医学,把医学问题想的太容易。这个工具不是临床上的痛点,是IBM自认为是的临床上痛点。但是,对于“个性化”的问题,知情人士提出了不同的看法。他认为,肿瘤一定是分级和分期的,在同一范围内,不同病人给出的治疗方案是一样的。中国肿瘤最大的问题,首先是标准化、规范化的问题,其次再谈个性化。尽管每一个体都有自身的特点,但是医生不会给1000个患者制定1000种方案。而沃森肿瘤的主要工作之一,是通过搜索医学文献和历史数据,快速为某一患者找到情况相似的其他患者。这一过程可以帮助医生在相似案例间获得更多的有用信息,在信息更充分的条件下做出更有说服力的判断。一直以来,这也是沃森肿瘤最具备争议的地方之一。图灵奖得主Yoshua Bengio就曾表示,在医学文本文件中,人工智能系统无法理解其模糊性,也无法了解人类医生注意到的微妙线索。国内一位研究NLP多年的学者向雷峰网(公众号:雷峰网)表示,“沃森的问题,是自然语言处理行业固有的问题——没有结构。结构是两个事物之间的联系,是关于知识表述的问题。没结构就没有推理,没推理就没有智能,解决不了这个问题很麻烦。BERT模型也没有结构,它只能说见过很多数据,它能猜。至于沃森推荐的方案,也是基于计算和概率,而这种概率的结果,对于临床没有意义。”癌症治疗方案的"个性化"和"标准化"、自然语言处理技术与临床应用价值,即便是在沃森肿瘤关停之后,这样的话题也会一直被讨论下去。
吴军在《浪潮之巅》中曾有一段论述:IBM能成为科技界的常青树,要归功于它的二字秘诀——保守。保守和谨慎,对于这家百年老店至关重要。从技术上讲,IBM是一家富有创新精神的公司。从计算机硬盘到DRAM,从智慧地球(现如今智慧城市的前身)、条形码到电子商务,IBM提出了很多先进的理念。所以,即便离开了沃森,但是在前员工们看来,沃森仍然是一个划时代的产品,甚至是超前于时代。但是,相比于谷歌等科技新贵,IBM的技术“存在感”正在慢慢减弱。想要实现多元化发展从来不是一件易事,对于IBM乃至其他巨头来说正是如此。当一家大型企业只是想在某个行业里试水,那么对待风险的韧劲是不够的,遇到失败就要后撤,因为试水的业务不是主营业务,不做不会伤及根本。因此,IBM在很多事情上往往起了大早、赶了晚集。和此前《依图医疗被变卖》所提到的“裁员事件”类似,IBM新任的印度总裁克里希纳上任,其一大策略就是全球大裁员,将与主营业务不相关的部门剥离出去,让股价更好看。在IBM明显的整体转云策略下,曾经风光的沃森肿瘤走到今天这一步,既是意料之外,也是情理之中。正如雷峰网此前所写,沃森肿瘤会像它的代号“登月计划”一样,成为历史的注脚。它的黯然退走,也不会是蓝色巨人在医疗领域的最后一舞。
雷峰网