癌症自出现之日就是环绕在人们头顶上的乌云,如今,随着社会压力越来越大,癌症发病率也越来越高,而攻克癌症一直是医学界正在努力的方向。
今年一月,美国总统奥巴马宣布了“抗癌登月计划”的科研目标,旨在让抗癌研究的进展速度翻一番,在 5 年内达到原本可能需要 10 年才能取得的成果,项目总预算大约 10 亿美元。
近日,据国外媒体报道,美国启动了全球首个“癌症先进计算解决方案的联合设计”( Joint Design of Advanced Computing Solutions for Cancer ,简称 JDACS4C)项目,旨在借助深度学习技术加快抗癌研究。该项目也是为了实现“登月计划”的十大任务之一——建立癌症数据共享系统。
负责人之一的 Rick Stevens 透露,在明年第二季度,JDACS4C 的首批成果将会面世。
之所以被称为“联合设计”,是因为 JDACS4C 项目共分为 3 个试点,内容涵盖了从分子学到人口学的研究。通过这些项目,研究人员希望能够提供可扩展性机器学习工具的研究信息,进一步发展深度学习、模拟和分析技术,更快地为用户找出解决方案,为未来计算解决方案的设计提供参考。最终达到“有效地利用逐渐多样化、不断增长的癌症相关数据,建立起预测模型,提供对疾病更准确的判断,进一步为患者的治疗提供指导,最终建立起未来癌症研究的新模型。”
大家先跟雷锋网一起看下这三大试点项目是个啥:
RAS 分子项目。该项目希望通过开发出新的计算方法,支持当前已经在进行的 RAS 分子研究,最终希望增强研究者对癌症中 RAS 基因及其相关信号通道的理解,在 RAS 蛋白膜信号复合体中发现新的治疗对象。
临床治疗前的筛查。这一项目以试验性的生物数据为基础,针对“机器学习、大规模数据和预测模型”进行重点开发。通过建立反馈循环,让试验模型对计算模型的设计进行指挥,而这些模型或许就能对准癌症中的新目标,帮助医生找到新的治疗方式。
人口模型。该项目希望开发出可扩展性框架,对全世界癌症患者的病情记录进行有效的归纳和分类,总结。根据人们的生活方式、所处环境、癌症种类、医疗体系等要素,从大量癌症病人的病历数据中自动分析,以获得最佳的治疗方案。这种引擎将对医疗健康的多个方面影响巨大,包括数据的分发,以及对成本的控制等等。
Rick Stevens 认为,深度学习对推动抗癌研究非常重要,“ JDACS4C 的每个项目都需要深度学习技术,但它们需要不同的使用方法。所以,我们需要了解软件环境和网络拓扑结构,以免重复劳动。”对此,研发团队重新定义了一些关键指标,以“解决和癌症相关的不同子环节的深度学习问题”。
Stevens 还表示,团队正在用深度学习技术整合细胞系中筛选出的化合物信息,并将其用在实验小老鼠身上,从而在身怀肿瘤的老鼠群里用不同的化合物进行测试,并监测老鼠们对给定药物有何反应。
此外,由于大部分的病理报告带有主观性,研究团队要让机器读懂所有历史数据是一个很大的挑战。
“我们首先建立了一个分类器,它会告诉我们肿瘤的类型以及它分布在人体的哪个部位。”Stevens 介绍到。
事实上,JDACS4C 项目的目标是让模型的发展独立于深度学习框架,这样一来,如果将框架更换,JDACS4C 也不需要调整模型。在深度学习领域,这是很常见的做法,即设置用于模型表达的脚本层。Stevens 在接受采访时表示:“我们正在与学术界和一些企业合作,比如英伟达,我们还开发了分层架构,这涉及到与深度学习领域各个组织的合作。”
不过,Stevens 也承认,目前想要获得大规模且高质量的训练模型数据仍然具有挑战性。“虽然我们建立的机器学习模型已经能够比较精准地预测出药物反应或者肿瘤的类型,但它并不能告诉我们预测的原因。模型不能解释自己的结果。”Stevens 说,“研究者需要以一种机械论的模型或者数据来提供支持,并且将这些与机器学习模型融合。这样一来,我们就得到了两个成果,一个是高精度预测的模型,一个是有解释能力的模型。这种混合方法会给未来的研究带来巨大的空间。”
JDACS4C 项目目前已经获得了美国能源部的资助,合作方还包括 Intel、IBM 和英伟达等。
Stevens 表示吸引供应商参与进来并不难,因为所有的 HPC(高性能 PC)供应商都制定了积极的深度学习发展路线图。
“英伟达优化了针对不同 GPU 的通用框架,英特尔也有许多机器学习方面的计划。可以这么说,我们正在与英特尔所有适合(JDACS4C)的部门展开合作。”雷锋网了解到,今年八月份,英特尔耗资 4 亿美元收购了深度学习平台 Nervana Systems公司,Nervana 虽然只是初创企业,但却拥有专为深度学习打造的全方位优化的软件和硬件堆栈,号称处理器速度将可达到 GPU 的 10 倍。
此外,Rick Stevens 及其团队还在评估最适合的深度学习框架,Stevens 表示:“我们正在寻找一种最适合该项目的机器学习框架。团队正在与供应商合作在硬件上进行优化。我们还和利佛莫实验室合作,包括开发可扩展的人工神经网络框架 LBANN。”据了解,谷歌、微软、Facebook 等公司也在团队的考虑范围内。
虽然目前 JDACS4C 试点项目仍处于创办初期,但这个牵动全球人民健康的项目已经备受关注。而它首批试验成果会是什么样,项目进展如何,雷锋网将会持续关注。
Via hpcwire
【兼职召集令!】
如果你对未来充满憧憬,喜欢探索改变世界的科技进展,look no further!
我们需要这样的你:
精通英语,对技术与产品感兴趣,关注人工智能学术动态的萝莉&萌妹子&技术宅;
文字不求妙笔生花,但希望通俗易懂;
在这里,你会收获:
一群来自天南地北、志同道合的小伙伴;
前沿学术科技动态,每天为自己充充电;
更高的生活品质,翻翻文章就能挣到零花钱;
有意向的小伙伴们把个人介绍/简历发至 guoyixin@leiphone.com,如有作品,欢迎一并附上。