包括谷歌、苹果、微软、IBM在内的科技巨头,在过去几年里都在做同样的一件事:聘请生物医疗界的领导者。
医学科学家从原来的研究室转移到科技公司,实际上对于双方都是一件好事。专注于临床研究的医学科学家并不总是有机会接触到足够数量的患者,并进行长期的研究。而这样的强强联手可以借互联网公司的雄厚资源获取多维度的大量健康数据,工程师还能为健康数据建立各种传感器及算法,并进行详尽的分析。简单说来,互联网公司,或者说它们背后的数据,对于科学家而言,真真是无法抵抗的诱惑。
这样的例子不胜枚举。
2015年9月,Tom Insel离开美国国家心理健康研究所,加入Google Life Sciences团队。
2015年底,Michael McConnell停下了斯坦福大学的心血管项目,加入谷歌。
上个月,致力推动开放医疗研究的Stephen Friend也加入了苹果。
但这样的趋势也说明了一个问题:不管是关注全人类的谷歌,还是专注消费者的23andme,他们都掌控着健康数据的所有权,或者说,他们控制着分析人类健康数据的方法,并运用于服务中。
目前有一个新词叫“黑箱社会”(Black Box Society),指的是用一些机构用不公开的数据分析工具进行数据处理和判断。比如在线广告商的“个性化推送”,或是针对特定群体的服务器优先,都可以视之为黑箱社会的表现。就像凯恩斯经济学“看不见的手”一样,数据分析里看不见的手,同样在悄悄发生着作用。
如果算法决策未被公开,却被用于健康分析,那么社会的黑箱效应就会愈发严重——因为你不知道自己已经被“区别对待”了,可能你也无从得知,自己已经被一些带有歧视性的健康描述所形容,更不要说去反抗了。
Nature认为,大量健康专家“迁徙”到硅谷,可能会为生物研究及医疗行业带来根本性的影响。
目前包括英国、瑞典、挪威和爱沙尼亚在内的国家,已经实现了电子健康记录的规范化,而这得益于政府和民间组织的推动。而美国也在未来五年内有望实现这一目标。与此同时,机器学习的进步让电子健康数据的未来增加了不少可能性。比起局限于个体案例的临床观察,覆盖大量人群的样本显然更适合机器学习来处理。
在以往,研究者们会在病房或诊所内进行观测及记录,数量大概是几十到上百个。此外,要抽丝剥茧地在这些综合数据里获取相关的信息,一方面代表性不足;另一方面也耗费时间和精力。而现在,通过智能手机上的各种应用,用户的位置、步数都能利用可穿戴设备记录下来,这样的数据就非常可观了。
而根据谷歌引擎的数据统计及分析,我们也可以窥见人们对健康,甚至是特定疾病的重视。目前谷歌正在采用Knowledge Graph算法来为用户推荐更准确的健康搜索结果。谷歌的一项统计表明,每秒钟产生的40000个搜索,有2000个是和健康相关的。
而提到机器学习,IBM的沃森自然是不能忽略的人工智能。IBM可以用自然语言和机器学习处理非结构化数据。而在今年,IBM还和与英国国家医疗服务体系(NHS)进行了二度合作,将和Moorfields眼科医院一同开发识别视觉疾病的机器学习系统。(详情可阅读:《继攻克围棋后,Deepmind想“看透”人类的眼睛》)
虽然目前可穿戴设备只能对特定健康指标进行监测,但它们所产生的实际功效要比传统的医学疗法要好得多。比如雷锋网此前提过的全自动“胰腺,就能实时监测用户的血糖水平,并及时给予调节疗法。
十年前,创业公司会收购各种健康数据,并转手卖给制药公司;但今时今日,几乎每一个科技巨头都想着要“进军数字医疗”。
许多企业进军医疗领域,目的在于通过管理上的进步和分析水平的提高,从根本上改变医疗护理行业。
就像前面提到的美敦力,此前在2013年就推出过一款血糖设备Enlite。但对于患者来说,即使用户能够在任何时刻监测血糖,但自己却对整体数据没有所有权。
即使企业乐于分享数据,他们也会对数据作分享限制。比如23andMe,它拥有全球最庞大的基因数据组,允许用户查看和下载自己的单个DNA,也可以分享给某些公司。但这样富有医学专业度的数据并不能解决用户心里的疑惑,他们还需要获得授权,将数据给专业的分析师,才能得到“听得懂”的检测结果。
长期以来,制药公司一直掌握着大量数据,但它们并没有实验之外的实际使用数据,而且也无从分析同一对象在不同实验中的情况。晚些进军市场的创业公司,则利用技术和可穿戴设备的优势,在数据的积累和学习中进行更精确的用户预测。
eMarketer在一份报告里指出,可接入互联网,并对健康数据进行分析、简化护理流程及医学研究的可穿戴设备,在2020年将会拥有超过1630亿美元的市场规模。但这些数据所凭依的算法,可能会阻碍科学的进步——就像前面所说的一样,企业可能会为了商业利益对用户的数据进行交易或是分析,而这未必是一件能给用户带来愉快体验的事情。
封闭的系统当然不是全无坏处,比如可以对数据进行统一的规范处理,这样无疑会提升运行速度。利用传感器或者其它分析方法,将数据整理为临床可用的信息,当然对社会是有益处的。而随着这样的企业增加,原来的仅靠出售数据为利的企业可能也就会日渐式微了。
这一点可能需要政府的支持——严格的监管和规定可能会阻止健康数据的分析和交易。目前,欧盟已经出台了相关法律,以防止人们的信息被商业化。而美国在目前的2-3年内实现这一点的可能性很小。
而对于一些科技巨头而言,它们拥有的资源——数据和计算能力,加上富可帝国的资金力量,几乎力可扛鼎。苹果、微软、Alphabet、思科和甲骨文,这五家公司在2015年的现金储备已经达到5040亿美元。但为了避免监管和税收,大部分都储备在海外,这就出现了政府有心无力的状况。
而鉴于这样的现状,自然杂志提出的一种解决方法就是开源。在上个世纪90年代,IBM放弃了服务器,而对开源软件下了苦功,而就在开源的ApacheWeb服务器和Linux操作系统形成了一个可行的软件,IBM就开始销售其服务。
而政府的资金支持同样可以鼓动健康数据的开放。比如人类基因组计划成立后,基因组测序公司Celera便把数据存储在数据库GenBank里,将业务转移到疾病治疗上。不过,目前政府的资金支持,还不及商业层面的投资。比如23andMe,它们家最近一轮融资达到了1.5亿元,已经达到联邦政府投给奥巴马政府精准医疗计划的70%。
但开放数据,特别是健康数据,存在的一个问题是隐私问题。用户不仅要打破“黑箱”效应,还要知道他们的数据来源如何被使用,在哪里被使用。而这些数据的安全性,同样可能会招致很多的社会讨论。
在医疗护理领域上,用户一直以来都处于被动的位置——虽然是他们选择了产品,但测量过后的数据,掌控权却不在他们的手里。只有当用户开始意识到这一点,为自己的健康数据负责之后,事情才有可能发生转机——守住健康数据的底线。