雷锋网 AI 科技评论按:2018 年 5 月 17 日下午,天津世界智能大会专题论坛「新一代人工智能核心技术论坛」在中国天津梅江会展中心举行。会议围绕国家新一代人工智能开放创新四大平台等方向对新一代人工智能发展的影响为主题进行深度的探讨。论坛聚焦自动驾驶、医疗影像、智能语音等热门领域,共话新技术,探讨人工智能发展现状与未来技术的趋势。
会议邀请了包括中国工程院院士、天津大学教授佘贻鑫院士;科大讯飞副总裁、新一代人工智能产业技术创新战略联盟联合秘书长李世鹏;现任中电数据服务有限公司董事长、中电数融投资管理(杭州)有限公司董事长李世锋;百度自动驾驶技术总监陶吉;阿里巴巴达摩院机器智能首席自然语言科学家司罗等 10 余位人工智能行业的顶尖技术学者、科学家以及政府、企业负责人先后在会上发言。雷锋网 AI 科技评论作为合作媒体针对会议进行报道。会议整体内容请参考雷锋网报道:
https://www.leiphone.com/news/201805/iOQ58RyUuXr4U0o3.html
本篇文章为中电数据董事长李世峰的报告内容,报告题目为:数据驱动人工智能,助力健康中国。
李世锋:中电数据服务有限公司董事长、中电数融投资管理有限公司董事长、中电健康基金管理合伙人、中国健康医疗数据大数据产业联盟秘书长,作为中电数据的主要创始人,用三年时间带领公司进入快速发展阶段,曾领导开展天绘系列遥感卫星数据接收管理及应用服务。
以下为李世峰的演讲内容,雷锋网做了不改动原意的编辑。
我的报告题目是《数据驱动人工智能,助力健康中国》。今天报告我将介绍医疗大数据的现状,医疗大数据技术,数据安全等方面的内容。
健康医疗大数据现在是国家战略,健康医疗数据目前是作为国家战略基础资源进行建设和管理的。为什么说大数据助推、推动人工智能、助力健康中国?之前的报告提到了人工智能的基础和引擎都是大数据,目前有一个 DIKW 体系,就是数据、信息、知识和智能这么一个体系,就是说基础是 Data,经过加一些内容变成 Information,信息经过应用场景的加载变成 Knowledge,最终知识形成 Wisdom,所以可以说数据是人工智能的一个引擎。另外数据的应用最大化要靠人工智能技术,所以中电数据的工作就是做「原料」、数据汇聚和数据管理以及搭载数据服务平台。
中电数据现在作为国家队承担了国家健康医疗大数据平台建设。之前国家的健康医疗数据中心主要部署在南方——福建、广东和四川等,现在我们准备在天津建一个云脑中心。
国家健康大数据试点工程主要的内容实际上就是把人数据化,从而构建一个智能的全息数字人。全息数字人的定义涉及人生命全周期、生活全方位、生产全过程,是这些过程中衍生出的心理数据、生理数据以及相关的一些行为数据的集合。这听起来比较抽象,用现在的技术来讲全息数字人可以分成三个部分,一个部分就是基因数据,现在基因测序、基因解读发展非常快。第二部分就是医疗数据,即医院里面检验检测的电子病历、健康档案等数据。第三部分实际上已经在人们身边,就是穿戴设备监控的行为数据。现在的数字人由这三部分组成。
前年 IBM 的报告提到过这三部分数据的大致比例,人一生中的基因数据大概是 6TB,医院的数据平均下来是 0.4TB,包括影像数据。穿戴传感器传输的用于实时检测人类健康的数据大概是 1100TB,就是 1.1PB。所以每个人一生中的数据保守估计在 1.2PB 左右,一个省的数据基本是 ZB 级别。我们现在研究的是如何把这些数字有机地采集和按照相应的逻辑聚合起来,这方面人工智能技术将会提供有力帮助。我们目前第一步是聚合医院数据,第二步是加载基因数据,第三步是叠加行为数据,这就是目前布局。
人工智能在医疗数据处理方面有两个应用方向,一个方向就是将现有的数据进行技术规划处理、业务规划处理,就是打标签标注,然后通过深度学习来训练,从而达到精准医学的目标。还有一种就是脑机接口,就是通过脑电波人机合一,把机器的优势跟人的优势有机地结合。脑机技术需要对电波进行数字化和识别,天津大学在该领域是国际领先的,所以我们也是把天津作为脑机接口技术的落地点。
中电作为国家队,原则上就是做数据服务,推动数据技术应用,对我们来说有两个核心能力是要着力打造的,一个是智能,一个是安全。
智能方面,我们跟 IBM 成立了合资公司,我们的想法是把 Watson Health 整套系统移植到中国,合作谈判的一个重要部分是 UDS 数据治理。我们工作的核心是多元异构数据的汇聚,即把医院不同的系统的数据进行汇聚,汇聚完以后进行初级的数据治理,然后再用 IBM 相关的分级分类分域的数据治理平台加上算法模型形成人工智能模型,来支撑下一步的应用。同时我们也逐步引进 IBM 在健康医疗方向的四个方面 150 多个解决方案,近期已经有 6 个解决方案在引进,一个是生命科学方面,主要是新药研制、基因研究,第二个是健康管理、慢病管理,再一个是智能影像,还有一些医院的智能管理的平台。
IBM 在整个 Watson Health 系统开发的过程中聚合的病历超过一亿条,医学影像超过三百亿,进行了大量数据训练。系统迁移到中国后,必须根据中国人的数据对它已有的知识库和知识成果进行修正。
安全方面,中国电子整个安全体系包含四个方面,本质安全、过程安全、工控安全和数据安全。安全领域其实还有动态安全,动态安全已经上升到国家间的系统攻防,目前中国能攻能防。我想强调一下工控和数据安全。工控安全主要涉及电力、电网。数据安全则具有特殊性,其实整个系统安全的核心就是信息数据的安全。
以上就是雷锋网 AI 科技评论对于李世峰董事长报告内容的全部报道。中国把健康医疗数据聚合之后再用人工智能赋能,一定能够在健康医疗方向上取得更好的成绩。