专访北京大学王立威教授：阿里天池医疗AI冠军团队是如何炼成的？

作者：奕欣

2017/11/06 12:51

雷锋网 AI 科技评论按：北京大学 LAB2112 团队在今年的阿里天池医疗 AI 大赛中又夺冠了。这支来自北京大学信息科学技术学院机器感知与智能教育部重点实验室的研究团队，包括四名硕士研究生王东、胡志强、罗天歌、杨泽，与博士研究生李傲雪，团队的指导教师为王立威教授。

王立威老师团队在医疗影像分析，尤其是肺部 CT 图像分析上有着深厚的研究基础和丰富的研究经验，曾参与 Kaggle Data Science Bowl 2017 肺癌预测大赛，于全球 1972 支队伍中获得第 4 名; 曾参与 LUNA 肺结节检测挑战赛，在肺结节检测和假阳性削减两项任务中均取得第 1 名并保持到 2017 年 7 月，相关文章发表在医疗图像计算顶级会议 MICCAI 2017。

在本次阿里天池医疗 AI 大赛中，王立威老师又再次带领团队获得了冠军。在比赛结束后，雷锋网 AI 科技评论第一时间联系了王立威教授，针对他在医学影像领域的研究做了细致的交流。

专访北京大学王立威教授：阿里天池医疗AI冠军团队是如何炼成的？

王立威，北京大学信息科学技术学院教授。长期从事机器学习研究。在机器学习领域发表论文 100 余篇。2011 年入选人工智能重要国际奖项 AI's 10 to Watch，是亚洲首位获得该奖项的学者。2012 年获得首届国家自然科学基金优秀青年基金。担任国际人工智能权威会议 NIPS，IJCAI 领域主席。中国计算机学会人工智能与模式识别专委会常委。

机器学习应用领域的「三岔路口」

2012 年以来，不论是深度网络层数的不断拓展，还是系统在数据集上的优异表现，都让学术界对机器学习有了重新的认识。对于王立威教授而言，彼时的他已经在机器学习领域做了大量的研究，并凭借突出的表现在 2011 年成为首位入选 AI' s 10 to Watch 的亚洲学者。

但王立威教授认为，这一切只是个开始。「机器学习在近年来取得了显著的突破与发展，除了理论的研究外，更重要的是，学者们需要看清技术对生活产生的重大影响。」王立威教授置身人工智能浪潮的前沿，自然也希望能在机器学习的应用领域有所作为。

经过王立威教授的观察和思考，他认为有三个领域会与深度学习进行紧密的结合，并希望能够选择其中一个方面来进行深入研究：一个是无人驾驶；一个是金融领域；再一个则是医疗领域。

王立威教授认为，无人驾驶在计算机视觉的识别技术已经趋于成熟，具备可以与机器学习进行深入结合的条件，但作为一个与汽车实体紧密相关的应用方向，在高校内做研究的空间相对受限；此外，驾驶作为一种动态活动，相对于静态图像识别的难度与复杂性要高得多。

而金融领域尽管积累了非常多高质量的封闭数据，但它属于噪声非常大的信号，受突发政策、人为操作的影响较大，并非总是严格遵循客观规律。

在这个应用研究的三岔路口上，王立威教授最终选择了医学影像领域。一方面，医学影像属于静态图像识别，相对于视频技术的处理技术要更加成熟；另一方面，依托北京大学的一系列附属医院，不论是从数据的获取或是系统的测试落地上，王立威教授所在的北京大学研究团队都有着得天独厚的优势。

既然选择了远方，便只顾风雨兼程。从 2014 年开始，王立威教授及其团队便开始了一段与医学影像的不解之缘。

在解决机器学习的问题之前，先向医生虚心求教

当时，医学界所采用的医学影像技术已经沿用了十年之久。在深度学习流行起来的一段时间内，也一直是以两种方法并行的模式同时发展。王立威教授前期采用了调研与探索的方式，利用机器学习在性能上的优势尝试原有的传统技术，一开始也取得了不错的效果。

但技术的落地并不总是一帆风顺。只满足于把自己定位于一个机器学习的研究人员来看待医学影像问题，将机器学习技术单纯地「嫁接」到医学影像原有的系统上，结果也还不错，但距离优秀、满意的系统依然还很远。王立威教授在经过反思和研究后终于意识到，问题的本质在于研究人员对医学影像缺乏真正深入的认识。

「计算机学科与医学毕竟还是两个完全独立的学科，不论是从知识体系或是根本性的思维方式都有很大差异。如果一位机器学习的科研人员要潜心做医学影像的研究，首先要从心理上克服畏难的心理，要有积极的心态去学习非常基础的医疗知识。」王立威教授告诉雷锋网 AI 科技评论，作为机器学习或是计算机学科的研究人员，更希望能比较精确、定量化地进行描述，如果是医学领域，在很多研究内容上往往更倾向于做定性的描述。

以医学影像的诊断为例，如果呈现某些特征，医学人员可能会认为这就是可能出现某种疾病的判断依据；但在同样的情况下，计算机学科的研究人员可能需要一个精确的定义，「需要满足哪些定量条件才能被视为符合的特征？」这种基于学科的思维差异容易在沟通和交流上产生障碍，继而影响机器学习在医学影像上的应用。

此外，机器学习领域目前在识别、检测、分割所处理的图像很多都是自然景象，与以 X 光、CT 或是核磁共振为代表的医学影像所处理的人体器官图像存在巨大的差异。而与机器学习所处理的单张图像相比，医学影像所处理的图像是逐层的扫描，在某种意义上是一系列的连续图像，又存在着不同的地方。「如果仅仅是将机器学习领域的现有算法直接套用在医学影像领域，我认为是很难取得什么好的成果的，」王立威教授表示，「我们得针对医学影像自身的独有特点，有的放矢地设计或大幅度地改进现有的算法才行。」

因此，王立威教授决定带领团队先对医疗知识进行系统性的了解，围绕特定病种的诊断基准进行整体的学习。其次，医生在对医学影像进行判断的过程叫做「阅片」，王立威教授也一同与学生们花了大量的时间学习如何掌握这一技能。

在医学知识有了质的提升后，以此为基础再做涉及细节的算法设计时，王立威教授发现系统的水平又上升了一个台阶。为了做好一个机器学习应用问题，这支高校团队花了很大的精力与时间去掌握基础的医疗知识。而王立威教授也表示，这也为系统的进一步提升、为与医生的沟通交流起到了关键性的作用。

秉承着这样的理念，王立威教授在医学影像应用领域做出了很多突破性的尝试，包括提出针对医疗影像检测的深度学习方法 ContextNet，以及将多个机器学习算法首次引入肺结节的检测系统。

比赛频获佳绩，应用任重道远

从算法层面，王立威教授及团队已经做出了不少的创新性尝试。而在王立威教授看来，如何提升病种检测的复现性或者说迁移性，同样是一个亟待解决的难题。「和医学影像相关的病种可能多达 2000 种，即便是常见的可能也有几百种。那么，解决了某一病种的医学影像问题后，同一方法是否能迁移到新的病种上？假设这些病种都是相对独立的关系，那么每次都需要从头做新的研究。」此外，考虑到不同病种包括了 X 光、CT、核磁共振等多种不同的成像方式，这一问题就显得更加复杂。

基于病种的数量庞大，病种的选择标准就成为了一个非常重要的问题。Google 早在 2016 年就开始着手用机器学习算法增强糖尿病视网膜病变的检测过程，而腾讯优图实验室也于今年分享过它们在糖尿病视网膜筛查的一些工作。在病种的选择上，王立威教授告诉雷锋网 AI 科技评论，从他个人的角度来看有三个需要考虑的地方。

首先是需求问题。从根本上，医疗影像依然是一个与实际应用的需求紧密结合的问题，因此疾病的发病率、死亡率自然是首要考虑的因素；此外，该病种的受众面越大，攻克这一病种所惠及的人数就越多。
其次是从技术上考虑。也就是说，根据目前的技术水平来看，是否能借助机器学习提升系统水平，通过医学影像的方式成功进行诊断？对于从业数十年的医生来说，不同的病种的判断难度实际上有着天壤之别。有的病种不需要一秒就可根据医学影像进行诊断，但有的病种即使花费大量时间，也难以得到一个很有置信力的结论。「所以，我们要从技术上对不同病种做尝试与判断，看看是否能从技术上帮助医生解决这样的问题。」
第三点则是对医生的帮助程度。一方面自然是从提升效率的角度来看。以肺结节检测为例子，一位资深医生依然需要 6-8 分钟才能阅一张 CT 片子，但对于系统而言可能就是一个秒级的概念，更不要说它可以 24/7 地工作了。

王立威教授提及的另一个方面则是反过来，利用机器学习的技术推进医生在诊断上的新发现。比如发现了以往传统阅片没有察觉到的诊断依据，让这一病种的诊断在医学上有所突破。尽管这一点目前还没有实现，但王立威教授依然怀有这样的期待。

在王立威教授的领导下，北京大学 LAB2112 团队曾参与 Kaggle Data Science Bowl 2017 肺癌预测大赛，于全球 1972 支队伍中获得第 4 名; 曾参与 LUNA 肺结节检测挑战赛，在肺结节检测和假阳性削减两项任务中均取得第 1 名并保持到 2017 年 7 月，相关文章发表在医疗图像计算顶级会议 MICCAI 2017。在本次天池医疗 AI 大赛中，王立威老师又再次带领团队获得了冠军。

如果是普通的开发类比赛，数据集与数据来源都是赛事组织方给定的，而且质量也非常高。但在现实生活中，考虑到标记数据的成本及数据量的限制，如何在减少对数据的依赖下提升模型的鲁棒性？王立威教授表示，一种较为容易实现且简单直接的办法就是采用预训练的方法，选择一些具有相关性且较易获取图像的领域，利用图像做网络的训练，再应用到具体的医学影像领域上来。这样一来，对数据的需求也会有相应的减少。

机器学习的可解释性一直是一个颇受重视的问题，而在本次天池比赛里，北京大学 LAB2112 团队在决赛答辩时也展示了它们在这一领域的相关探索。「以肺结节比赛为例，医生的判断其实也是看这个级别形态上的一些特征，比如毛刺或是空洞出现的频率较高，那么判断为恶性的可能性就比较高，我们通过分析神经网络，发现它确实对提及的特征关注得比较多。也就是说，可解释性会在节点附近的区域使得神经网络的响应呈现最大化，那么反过来，这也与医生的经验判断是吻合的。」

参加了如此多的比赛并取得了突出的成绩，王立威教授对此则以一种谦虚乐观的态度对待。他认为，参加比赛的目的只是锻炼队伍、检验水平，与其它的团队进行切磋和交流，在未来最重要的事情，还是要解决实际问题。「在真实的医学场景中广泛地应用机器学习，才是我们最希望看到的结果。」