2018 世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge,下称 ASC18)于近日在南昌大学进行历时五天的总决赛,诞生总冠军、亚军、e Prize 计算挑战奖、最高计算性能奖和应用创新奖等多项大奖,并颁发总额超过 20 万元的高额奖金。最终,清华大学成功卫冕总冠军,首次入围总决赛的「黑马」上海科技大学收获亚军和 e Prize 计算挑战奖两项大奖,台湾清华大学获得最高计算性能奖。
ASC18 由亚洲超算协会、南昌大学、浪潮集团等单位联合举办,共有来自北美洲、南美洲、非洲、亚洲、欧洲、大洋洲等 6 大洲、全球 300 多支大学生队伍报名参赛,再度刷新了往届参与人数。
据雷锋网 AI 研习社了解,ASC18 的初赛赛题包括 AI 相关的机器阅读理解赛题 Answer Prediction for Search Query、生命科学冷冻电镜应用 Relion 及超算基准测试 HPL&HPCG 三项应用测试优化。根据比赛要求,团队需要在 3000W 的总功耗条件下设计超算系统方案。参赛队伍如何对计算性能、功耗控制、高速网络、加速器、软件环境进行综合考量,并设计出符合比赛规定的超算系统设计方案,这也是 ASC18 评审委员会的重要评估标准。
Answer Prediction for Search Query 基于 CNTK 深度学习框架,团队需要独立开发机器阅读理解和问答的算法模型,使用最新超算技术结合 MS MARCO 数据集进行训练,以试图让机器更准确地回答问题。据悉,e Prize 奖项即是专门为本赛题所设置的单项大奖。
生命科学冷冻电镜应用 冷冻电镜技术能够帮助突破传统 X 射线、传统晶体学长期无法解决的结构生物学领域问题。
HPL&HPCG 是国际通行的超算基准测试标准,要求超算系统的运算性能、内存容量、带宽以及互连性能之间取得平衡。与广泛使用的 HPL 基准测试相比,HPCG 评测标准更加复杂,但 HPCG 更容易反映出有限元法和流体分析等超算实际应用的性能。
经过初赛的激烈角逐,主办方最终从 300 多支队伍中甄选出 20 支团队进军决赛。具备强大竞争力的高校不在少数,比如曾包揽 2015 年 ASC、ISC、SC 总冠军的清华大学;曾获 ASC14 最高计算性能奖的中山大学;曾获 ASC13 MIC 应用优化性能奖和 ISC13 最高计算性能奖的华中科技大学等。当然,也有包括上海科技大学、南昌大学等首次参与 ASC 的高校团队。今年共有五支海外团队参与 ASC18,包括德国埃尔朗根-纽伦堡大学、俄罗斯圣彼得堡国立大学、匈牙利米什科尔茨大学、泰国农业大学及美国德州 A&M 大学等高校。
在初赛三大命题的基础上,ASC18 总决赛增加了 NASA Langley 研究中心最新开源的计算流体力学软件 CFL3D 及神秘应用 SIESTA。
此次 ASC18 上,以台湾清华大学为代表,共有 11 支参赛团队打破了浮点性能赛会纪录。ASC18 竞赛评审委员会主席莫则尧研究员在回顾比赛时,提及了新一年 ASC 的三个最大亮点。
我们超级计算技术得到了飞速发展,我们的参赛队伍水平也有明显的提高,两项综合起来,才有这样的好成绩。;
其次,参赛队伍的持续增长。ASC 超算竞赛的一个主要出发点就是培养人才,今年有 300 多支队伍参赛。青海大学队伍来了,还拿了 HPL 第二名的好成绩。当然还有东道主——南昌也取得了很好的成绩,这也是我们新的突破。还有一些大学持续保持了比较良好的竞技状态。
第三个亮点是 ePrize 奖的 AI 应用。当前,超算越来越成为 AI 的支撑技术。该赛题针对网上提出的问题进行回答,回答是否精准是衡量指标,这就需要计算机准确理解问题的内涵。这一次我们取得了很好的成绩。这三个方面给了我很深的印象。
在与莫则尧研究员交流的时候,他告诉雷锋网 AI 研习社,从竞赛的角度来看,一个好的超算系统应该具备三个特征。
首先要达到功耗要求。整个比赛环境限制了 3000W 的实时总功耗,也是对选手如何调配资源,构建「绿色」系统的一个重要考验。
其次,系统的性能需要达到一个性能综合平衡的状态,也就是所谓的应用上的「通用性」。当前,科学计算是一类应用,大数据和深度学习是一类。在设置赛题的时候,组委会特意涵盖了目前超算运用的主要分支,这也对团队的架构设计规划提出了更高的要求。
第三点则是稳定、可靠性。一个系统要真正能应用于实际产业,不能经常出各种问题。
上届冠军清华大学代表队是今年 ASC18 的夺冠热门。
在 20 强队伍中,清华大学完成赛题数量最多,且多项赛题中均取得佳绩,毫无悬念摘得总冠军。清华大学的李北辰同学告诉笔者,这是他第五次参与超算系列赛事,也是第二次参与 ASC。而团队中的其它成员都至少有一次参与超算赛事的经验,因此可谓是一支训练有素的精良队伍。此外,李北辰也提及了他们在确定机器配置时的一些心得体会,在性能与功耗之间取得平衡。比如,他们在实验过程中发现,生命科学冷冻电镜应用 Relion 在增加硬件的条件下性能并不会有明显提升。这些经验都为清华大学代表队的成功打下了扎实基础,卫冕冠军可谓实至名归。
首次入围 ASC 总决赛的上海科技大学代表队斩获了亚军和 e Prize 计算挑战奖,成为 ASC18 的最大「黑马」。其在人工智能机器阅读理解赛题中,针对模型算法和训练性能提出了自己独特的创新及改进,8 小时内完成大规模数据集的并行模型训练,并实现 46.46 的高预测精度,接近世界前沿先进水平,获得 e Prize 计算挑战大奖。
上海科技大学是以全队第一的成绩进军决赛的。在比赛现场与微软代表交流时,他们也对上海科技大学在阅读理解赛题所表现的突出成绩感到非常惊喜。
上海科技大学的殷树老师在采访中表示,他们的主要策略是跟踪学界的潮流,从前沿成果中吸取经验,选取一些高效的部分加入到模型当中去。此外他也提及,上海科技大学的教学理念,教学方式,与传统高校有着相当大的不同,学生在课堂上就已经大量积累了编程实战和结构设计的经验,且学校对学生们参加各类比赛也持鼓励和肯定的态度。此外,学校内还有一个学生社团 Geek Pie,在本次召集 ASC 比赛团队的过程中起到了非常重要的作用。
人工智能与超算的结合并非首次在 ASC 赛场上出现,在 ASC16 上,选手需要对涉及英文、中文普通话、四川方言三个语种共约 60 万条科大讯飞提供的语音数据实现高准确度训练模型;而在 ASC17 中,围绕百度提供的历史交通大数据,团队需要对深度神经网络模型进行优化,对早高峰的道路交通进行预测。而今年 ASC18 比赛采用的则是一个比 SQuAD 更具难度的机器阅读理解与问答数据集——微软 MS MARCO。
此次 ASC18 竞赛的初赛阶段,微软提供了该数据集中的部分数据供训练模型使用,并提供了基于 CNTK 的基准代码和相关论文让团队们参考。而在决赛阶段,微软提供了一个全新测试集供选手们挑战。
这一赛题基于各参赛队训练模型的机器阅读理解回答预测的准确率,对快速学习机器阅读理解与问答的算法特点,熟练应用 CNTK 深度学习框架提出了更高的要求。由于赛题的数据集规模较大,如何充分发掘利用超算硬件的计算潜力也成为赢得比赛的关键。「ASC18 的人工智能赛题要求参赛队伍自己动手开发机器阅读理解的算法模型,运用最新超算技术来加速训练速度及提高精度,更要用真实的问题数据集来验证模型训练的成果。」
而台湾清华大学代表队采用浪潮 AI 超算服务器配置 Tesla GPU 加速卡构建了先进的异构加速超算系统,在 3000W 功耗约束下实现整体系统 42.99 万亿次/秒的持续浮点运算性能,大幅刷新了 ASC17 创下的赛事纪录,获得最高计算性能奖。
今年的东道主南昌大学也有代表队首次进入决赛圈,南昌大学朱友林副校长在采访中也表示,南昌大学未来将在五个方面培养 HPC&AI 相关的人才。
第一,南昌大学已经决定要成立人工智能研究院,这是一个校级研究院,旨在加强人工智能方面的研究。
第二,南昌大学已经搭建起深度计算平台同时与浙江大学合作成立了虚拟现实产业技术研究中心,与浪潮合作建立了高性能计算实验室,为我们开展有关研究提供了一定的条件。
第四,南昌大学去年申请获批了「数据科学与大数据技术」本科专业,今年准备招生,培养有关高素质人才。
第五,南昌大学也开设了一门名为「大学生超算系统设计与应用」的课程,一方面是希望向更多学生普及超算知识,另一方面也为参加高水平 ASC 赛事打好人才方面的基础。
ASC 是由亚洲发起的世界最大规模的大学生超算竞赛。由中国在 2012 年倡议成立。「ASC 旨在通过超算赛事,推动各国及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新。」迄今为止,ASC 竞赛已吸引全球超过 5500 名年轻人才参与,参赛队伍总数超过 1100 支。
莫则尧研究员在采访时强调,ASC 竞赛的定位首先是培养人才,第二是要推动超算技术的普及。正如 ASC 竞赛发起人、中国工程院院士王恩东所说,「我们希望 ASC 不仅是一个全球化的超算赛事,也会成为一个全球超算领域的交流平台,在全球化的产业交流和发展中,发挥越来越重要的作用,这也是我们下一步的工作重点。」与此同时王恩东也表示,未来组委会将继续与各方携手,在赛制、赛题和赛事组织方面增强投入,并希望 ASC 能够成为一个公共平台,让不同领域、不同国家和地区的技术专家和机构进行深入交流,让各个产业环节能够更好地协同,从而推动整个产业的健康发展。雷锋网也同样期待,下一赛季的 ASC 能带给我们更多精彩!