在医学领域,人工智能应用于哪些领域?
对此,斯坦福大学生物医学信息学负责人Russ Altman博士认为,“机器学习和神经网络在发现大型生物数据库的规律时是非常有用的。”
那么,数据充裕的地方,人工智能才有可能插足。目前,医学领域中,AI涉足最多的几个领域包括:
精准医疗:基于“组学(omics)数据”,包括基因组学、基因转录组学、蛋白质组学、代谢组学等。
辅助诊断:基于病历、文献等医疗大数据。
药物研发,解决药品研发周期长成本高的问题。(AI在药物研发环节能做什么?雷锋网之前曾有对此的盘点:《AI加速药物研发过程:从7000874个小时变成几天》,这里不再赘述)
医学影像识别:基于大量的影像数据。
除此之外,还有人工智能与可穿戴设结合,进行个人健康数据预测和管控疾病风险。本文主要讨论精准医疗、辅助诊断、医学影像识别三个比较热门的领域。
随着基因测序成本呈超摩尔定律的势态发展,基因行业出现了这种状况:基因信息冗余、解读速度跟不上。与数据有关的工作包括:数据库的搭建,基因数据处理,基因数据的智能化解读,在这个领域,不同公司切入的角度不同,但终极目标是相同的:让基因组与表型组/疾病组对话。
在该领域中,梦想最雄伟壮阔的当属这家公司。
寻找碳基生命的硅基未来。
这是成立半年估值超过10亿、跻身独角兽行列碳云智能打出的口号。这家公司想要涉足组学领域的各个层面:基因组、转录组、蛋白组、代谢组、免疫组。
具体来说,碳云智能想要做的事情是:
人体数字化:关于人全局的数据化生命,从静态到动态数据,再到行为和社交数据等。
人工智能化:解决不同问题的应用,各种各样的信息化分析。
网络化:所有数字生命网络化,形成互联网体系平台。
换言之,碳云智能想把人体彻底数据化,这其中,人工智能是其神经系统。而这正是人工智能在医疗领域的终极目标。2017年1月5日,碳云智能发布了觅我平台,用于获得人体各方面精确的量化数据,在其发布会上,公司CEO王俊说道“碳云智能未来20年要做的事就是理解生命本身”,也就是说,这个宏伟蓝图的实现可能要等20年的时间。
国内其它初创公司则扎根一个环节,将其AI技术应用于遗传病诊断、消费级基因检测服务、肿瘤检测等领域中。
2016年4月,北京金准基因科技有限公司,发布了遗传病智能化解读系统——明鉴系统,该系统的主要操作过程为:
样本收集,DNA提取和处理,然后测序,或者进行一些实验操作之后,对词其数据进行分析,后由专家团队根据数据分析结果进行疾病关联性分析,最后出报告进行遗传咨询。
在构建过程中的难点是症状关联性分析,核心是数据库。在数据库方面,每家公司的打法不同。据雷锋网所知,金准基因选择了中文人类表型标准用语联盟(CHPO);而塞福基因,推出据称是国内首个聚焦于全基因测序数据实现疾病精准诊疗的解析工具,用64名博士耗时两年时间构建了一个疾病、基因、药物关联数据库。
近些年来,国内消费级基因检测服务也风靡一时,目前基因检测主要的依据来自于科学研究文献,但相关知识、数据积累不够,检测分析结果跟事实并没有百分百的对应关系。业内人士曾对雷锋网说道:
每个公司从自身的算法模型分析数据,不同公司的解读报告不一样,相当于看问题的维度不一样。不同公司的准确性没法比较,而且其自身本身没法量化,但我们背后的数据是一样的,只是解读的方式不一样。
2015年,药明康德旗下明码生物科技为英国国家基因组计划提供罕见病及癌症临床数据解析服务,明码生物科技已经可以实现从测序到数据存储,再到数据解析一站式的服务。
2014年10月成立的奇云诺德,构建了一站式生物信息大数据平台,包括基因数据发动机、大数据挖掘软件、数据可视化工具以及订制化流程。
对于整个基因数据解读行业来说,目前通用的挑战如何实现资源共享建立完整的实效性强的中国人基因数据库,如何制定行业的标准、以及应该投入多少人力财力到基因数据解析工作中等。
2016年底,百度研究院大数据实验室高级数据科学家沈志勇在介绍百度大脑时说道:
据权威机构预测,2017年数据生成和共享速度将增长至1200.6亿GB/月,2020年人类产生复制的医疗数据总量达40万亿GB。
2016年10月,百度发布其“百度医疗大脑”的首个产品化项目,其工作过程具体是这样的:
“百度医疗大脑”是通过海量医疗数据、专业文献的采集与分析进行人工智能化的产品设计,模拟医生问诊流程,与用户多轮交流,依据用户的症状,提出可能出现问题,反复验证,给出最终建议。在过程中可以收集、汇总、分类、整理病人的症状描述,提醒医生更多可能性,辅助基层医生完成问诊。
在这方面,百度具有两大优势:
数据优势:百度自身拥有庞大的医疗数据库
技术优势:可进行细分:如图像识别、语音识别、机器学习等技术分支。
相对于百度来说,国内其他初创公司在数据来源与发展路径上均有不同。
2015年成立的公司大数医达,利用大数据深度学习,整理三甲医院专家的临床诊断经验和治疗方案,构建完善的知识图谱,并对用户的输入进行语义分析,输出相应的第二诊疗结果。
2016年7月,康夫子也发布了康夫子医疗大脑,其CEO张超在雷锋网的公开课上介绍其公司做这样的事情:
让计算机去阅读医疗文献,构建知识库,赋予这些知识库一些推理能力,最后达到辅助医生、患者的目的。在产品维度,分为面向患者和医生;医生端分为全科与专科医生。它们的底层是相似的,都是知识图谱加推理,不过上层应用有差别。患者偏重逻辑问答,包括患者语言的理解;全科医生要求知识面,而专科则要求临床路径监控,包括医嘱的下达。
成立于2013年的医渡云则集中做临床数据挖掘。据称,其技术优势是异元异构的医疗数据的集成和后结构化处理能力,以及在疾病诊断的ICD10自动编码等方面。并且CEO孙喆介绍,未来公司还将扩展至医学影像数据。
目前整体上,智能诊断还处于初期,目前没有可以实现大规模商用。
关于智能诊断的挑战,张超认为:
技术上,我们现阶段认为智能诊断的底层核心是知识图谱,诊断的过程是基于知识图谱实现的推理过程。知识图谱的规模从根本上决定了智能诊断的瓶颈。另外就是应用上的挑战,智能诊断不管服务谁,在应用场景上有很大的差别,要有针对性地提升效果;而在非技术上,重点要让老百姓及医疗机构认可或理解这套诊断逻辑。
图像识别是深度学习等人工智能技术最先突破的领域,目前看来医疗影像也会是人工智能与医疗结合中,最可能先发展起来的领域。
相比国外,国内在医学影像结合人工智能技术方面的热度似乎更高。对此,雷锋网曾撰文《国内人工智能+医疗影像公司大盘点:今年又是“元年”? | 2016 影响因子》中提到,从公司的发展路径看,医疗影像智能诊断的公司大致可以分为两类:
第一类公司主要以人工智能技术,提供影像分析与诊断服务,其中以DeepCare、推想科技、图玛深维、雅森科技等为代表,且一般成立时间较短。
比如,DeepCare主要研发医疗影像检测、识别、筛查和分析技术,为医疗器械厂商和基层医疗中心提供影像识别服务,对新录入数据库的病例,它可以进行算法匹配,寻找出影像数据相似的案例;雅森科技则专注医疗影像分析应用,基于医疗影像定量分析,用数学模型和人工智能技术提高诊断精确性。
第二类公司原先提供医疗影像云服务,而后将服务延伸到智能诊断领域,其中以汇医慧影、医众影像、医渡云为代表,成立时间一般为二到三年。
比如,汇医慧影是一个独立第三方的医疗影像咨询平台,早期专注基于云平台的线上影像中心,从今年开始着重向人工智能领域发力,辅助影像的筛查;医渡云主要提供医疗大数据和医疗云平台解决方案,同时利用机器学习的方式,挖掘临床数据中的文本数据和影像数据。
这一领域目前发展到哪一步了呢?
对于发展状况,我看来,无论在中国还是美国,在算法和数据上看,这一领域的发展都是在早期。它已经走出了实验室,但离商业化还有很长的路要走。
对此,DeepCare创始人兼CTO丁鹏博士如是说。他介绍说,“其中最大的难点是:如何进行大批量数据的标注,以及标注质量控制”。而现在的医疗影像几乎没有对病灶进行标注,而这种系统性的数据整理过程又十分专业,需要专业医生配合。
目前来讲,眼科医疗领域的人工智能应用相对于其他专科仍处于比较空白的阶段。
旨在应用人工智能/模式识别技术开发云端眼科诊断系统的BigVision(比格威医疗科技)CEO陈新建讲道。
相对于其他,眼睛的结构比较特殊,不能做CT、MRI,而基于OCT的眼球成像也要精细得多。
人工智能深度神经网络通过图像预处理、图像特征提取和分类等步骤识别医学影像。通过大量准确标注的眼底照片和医学数据,对模型进行训练和测试,并且通过大量医学知识的学习,最终能够得出准确识别医学影像的人工智能模型,从而诊断青光眼、糖尿病视网膜病变、老年性黄斑变性、角膜疾病等眼科疾病。
在该领域,其中,BigVision“目前,我们产品1.0已经开发完成,目前正在几家大的合作医院当中试用。”而该领域的另一家公司AicDoc,其算法在有明显症状和无明显症状二分方面准确性与三甲医院资深眼科医生持平。
相关文章: