AI掘金志(公众号):雷锋网旗下只专注于报道AI商业化与落地的垂直内容频道。助力“AI技术输出者”寻找商业潜力大的落地场景,服务“AI技术消费者”选择适合自身的技术供应商。
雷锋网AI掘金志主要推送两类文章:
1.深入挖掘AI公司与传统机构的合作案例。
2.剖析各地医院、银行、制造企业、零售商、政府部门等传统机构对AI的需求与实际应用情况。
2017年5月10日,2017年中国SaaS产业峰会|医疗大数据应用创新论坛召开。北京大学人民医院医学信息中心副主任王力华女士分享了人民医院在这方面的实践经验。
2013年,北京大学人民医院就建成了临床数据中心。
医院产生的数据包括医嘱、检查、检验、病例、文书、费用信息和大量的影像数据。王力华称,北大人民医院内部已经有了结构化数据:
我们做了一个临床数据中心项目(CDR),用几年的时间将医院的各个信息系统进行了整合。
该系统是以病人的基本信息作为主线,将病人在医院里的历次就诊信息都串联起来。
据王力华介绍,目前临床数据中心数据存储量是2.5T,患者数430万,医院中35个信息系统作为其数据来源,每月有八万次的访问量。
随后,基于搭建的临床数据中心,北大人民医院建立了科研平台,以CDR为数据源,存储基于大数据架构,更适合科研数据的查询和提取。
王力华称,因为医院对科研数据需求比较多,随后就在HRP上建立了一个申请流程,根据需要提数据查询需求。从15年建好到16年,已经做了400多个统计查询,其中比较明确的针对科研研究方面的需求有100多个。
北大人民医院内部科研数据查询的需求涉及35个临床科室,“应该绝大多数科室都提出过科研查询需求。”数据查询目的分为这几类:科研项目;写论文;做前期研究;研究生课题;临床试验。
对数据的科研需求涵盖方向各种各样,特点有这些:
第一,大部分需要患者基本信息,像住院号、门诊号、性别、年龄等。“他们可能需要做随访,或者到病案室整理其他的病案信息,需要基于这些信息查询。”
第二,需要长时间段,“他们不会考虑信息系统从哪年建立的,或从什么时候开始有数据的,而是从自己的研究角度,提很长时间段的要求。”
第三是涉及到多个信息系统数据。“根据我的观察,最常用的临床数据是诊断和检验数据,基本上每个需求中都会提到。”
王力华称,科研查询平台特别受医生欢迎,尤其是大型三甲医院的医生有很多课题,写论文的压力很大。
我们医院有900多名医生,而科研查询平台的用户数达250多人,占27%;临床科室44个,已经有账号的是35个,占到80%;使用最多的一个月查询数达2700多次。
临床数据的产生过程是:住院医生医嘱—护士站确认—药房摆药—药师复核—送到护士区,这个过程涉及5个信息系统,这些系统联合起来才能完成整个住院病人发药的业务场景。对应的是,每个系统产生不同的数据,这些数据是互联的,所有的数据会存到临床数据中心,整个串联起来形成了整个数据系统。
临床信息系统对于人记录的是工号、登陆的账号;时间是读取的服务器时间;地点是设置的一个地点或者机器所在的位置;事件是应用的功能。临床信息系统是一个运行过程中的系统,所记录的数据更适合运营管理,所以这个系统对科研都局限性。
另外,有些业务流程在信息系统中没有形成闭环,比如医院没有门诊用药效果数据。
其次,运行系统中记录了当时的使用场景数据,有些不是特别准确,不能达到科研数据的要求。
最后,医生面临实际业务使用运行系统,要求操作的便捷性。系统中有一些简单的功能,比如复制、事后补录等,这种特性对于科研有一定的局限性。
检验结果、检查报告、电子病例里面入院记录和病案首页等相对更适合于应用于科研。王力华称:
一个比较大的问题是,我们数据中心中已经有2196个数据项了,但仍然不能满足医生科研查询的需求。医生的科研需求非常细致,数量很多。
我们现有的数据根本达不到他们的要求,很多地方是没有数据记录的。
对于科研数据和临床数据的差异,可能有一个解决办法,搭建一个一体化科研平台。
临床信息系统,是不是可以补充进去科研的数据呢?
临床数据与科研数据的差异能不能补充进去呢?
王力华称,这有一定的难度,对于临床业务来说,系统操作越简单越好,但加入科研数据就变复杂了,而且,操作人员填写数据不及时、不专业。
对此,建立各临床科室的专科数据库可能是一个好的解决办法。专科数据库能补充一些需要的科研数据,包括在业务系统中无法采集到的数据、一些特定的专科数据、一些不需要病例的数据。
另外还有随访系统,主要用来补充病人数据。
病人就诊结束后或住院病人出院后的转归数据,治好没?效果怎么样?
但一个项目经常有几千样本量,做随访还是很复杂的,所以随访平台一定要适合多科室、各种不同项目。另外,要把临床的信息系统和科研系统整合起来。
随访系统中往往涉及病人隐私信息,比如姓名、地址、电话等,这方面需要加强隐私保护。如果可能,通过随访中心,随访人员并不知道病人电话,就可以把电话拨出去;还有通过其他方式搜集数据,而不是用挨个打电话的方式,也是值得尝试的。
但是,打造多中心平台也有一些困难。
第一,医院的数据都是要手工录入的,自动读取数据的难度非常大。
第二,手工录入的数据质量很难控制,还有医院间的协调要花费大量的工作。“医院对于系统自动提取数据的技术需求是非常迫切的。”
王力华称,提供科研数据有一个特别大的痛点就是数据安全。
主任给我了一个建议,最好把后期数据挖掘的工作封装在平台上,原始数据不出平台,就可以拿到结果。我们也想做这方面的尝试。
医院搭建的统一科研平台,至少包括CDR临床数据中心、科研数据的查询平台、专科数据库、多中心平台、随访系统以及最后的数据分析。从提取数据到最后数据分析成果,都在这个平台上完成。
王力华称,
关于这个科研数据平台,我觉得现在一定有机会来做这个事。感觉医院和厂商都有一些转变。
从医院管理的角度,医院科研管理部门原来不太愿意管理这些小系统,比如随访或者多中心的平台,而现在他们愿意帮助大家建立一个全院级的科研平台。
从临床科室的角度,之前很多主任可能不愿意共享自己的数据,不跟信息中心有交互,把自己的专科数据库当成自己的宝藏。而现在比较开放了,他们也认识到信息中心的大量数据能给他们提供很多支持,而且省去了很多重复的录入,提高了准确性。
从信息中心来讲,经历了医院临床信息系统到运营信息系统,开始逐步为医院的科研方面做一些工作。
从厂商方面,几类厂商进入到了新领域中,原来传统科研统计厂商会跟临床科室主任合作做一些科研课题,现在他们也希望往大数据这方面转型,他们在科研方面有很多的经验;大数据厂商的大数据技术正好是可以充分利用,这个领域有很广泛的前景。
医院原来的信息系统厂商,比如HIS和电子病例厂商,他们有很多临床信息系统的经验,基于这种经验进入到新的领域,也会有很大的优势。
更多关于人工智能升级传统行业的文章,请关注雷锋网AI商业化垂直微信公众号:AI掘金志(ID:HealthAI)。