作者 | 王晔
11月15日至11月17日,SC21国际大学生超级计算机竞赛在圣路易斯举办。清华大学计算机系新一届超算团队再次摘得总冠军。这也是清华继SC18、SC19、SC20后拿下的四连冠!总分排行榜中,清华排名第一,上科大次之,南科大第三。同时,南科大获LINPACK基准测试最高性能奖。克莱姆森大学(Clemson University)
佐治亚理工学院(Georgia Institute of Technology)
波士顿大学、波士顿学院、麻省大学罗维尔校区联队(Boston Univ., Boston College, Univ. of Mass. Lowell)
北京大学(Peking University )
上海科技大学(ShanghaiTech University )
南方科技大学(Southern University of Science and Technology )
加利福尼亚大学圣迭戈分校(University of California, San Diego)
维克森林大学(Wake Forest University)
暨南大学(Jinan University)
清华大学(Tsinghua University)
全球超级计算大会(Supercomputing Conference,简称SC)是国际超算领域的顶级会议,国际影响力巨大。国际大学生超级计算机竞赛(SCC)成立于 2007 年,是超级计算机领域的顶级赛事,今年是举办该竞赛的第15个年头。受新冠疫情影响,此次比赛与去年一样线上进行,可远程参与。作为Students@SC计划的一部分,SCC旨在将学生引入高性能计算社区,推动世界各地区超算青年人才交流和培养,提升超算应用水平和研发能力。比赛吸引了来自世界各国家和地区的众多高校参与,与ASC超算竞赛和ISC超算竞赛并列为世界最具权威性的三大国际大学生超算竞赛,给了学生一个在竞争中展示自己专业知识技能的平台。几个月前,清华大学学生超算团队刚夺得了国际大学生超算竞赛(ISC2021)总冠军和LINPACK 基准测试最高性能奖,获得双料冠军。代表清华参加此次SCC队伍由6名清华大学计算机系的本科生组成。由于赛事规定参赛队员必须是本科生,因此团队组成相较去年有了较大的变动,其中有四名队员是新成员。对新成员而言,这是他们第一次参加该项赛事,但也是一战即胜。在得知清华大学学生超算团队在该项赛事中获得四连冠后,AI科技评论联系到了他们,并同他们针对比赛情况进行了交流,对话内容整理如下。在谈到今年SCC整体上和去年以及往年有什么不同时,清华超算团队表示今年赛事和去年都是以线上的形式进行的,线下比赛需要参赛者自行搭建物理比赛集群,线上比赛则需要选手合理选择云服务资源。“今年和去年对比,今年的比赛「氛围感」更足了。主办方提供了在线交流平台,在比赛中,各个队伍间、参会人员和队伍间都可以方便地进行交流互动,让我们感觉仿佛在线下参加比赛,体验很好。”和往年一致,今年的赛题设置同样考察了选手对经典HPC应用的编译、运行、分析、优化能力。大赛赛题包括基准测试程序LINPACK HPCG IO500,多尺度心脏模拟 Cardioid,量子材料模拟Quantum ESPRESSO,SC20论文复现题以及现场公布的神秘应用“高能中微子物理中的图像分类应用Cosmic Tagger”。三大基准测试程序中,Linpack 基准测试是计算机浮点执行率的度量。它是通过运行一个计算机程序来确定的,该程序求解了一个密集的线性方程组。它被TOP 500用作对峰值性能进行排名的工具。而高性能共轭梯度 (HPCG) 基准测试项目旨在创建一个用于对 HPC 系统进行排名的新指标。HPCG旨在作为高性能LINPACK(HPL)基准测试的补充,该基准测试目前用于对TOP500计算系统进行排名。除此之外,IO500 基准测试是高性能 IO 的基准测试套件。它利用现有和受信任的开源基准测试(如 IOR 和 MDTest),并捆绑执行规则和多个工作负载,目的是评估和分析各种 IO 模式的存储设备。清华超算团队认为LINPACK HPCG IO500是每年不变的必考项目,已经比较熟悉了。多尺度心脏模拟器 Cardioid是一款用于模拟临床心脏现象的心脏模拟套件。它能够模拟电生理和机械器官级模拟,并具有用于计算心脏网格,重建躯干ECG和生成逼真的心脏纤维方向的处理工具。,曾在 SC12 入选 Gordon-Bell 奖的 Finalist。Quantum ESPRESSO 也是一个经典的科学计算软件,在材料等学科有着广泛使用,属于超算上的经典应用,也曾在几年前的 ASC 比赛中出现过。在复现题中,选手需要承担审查SC20论文的角色。SC21复现题委员会选择了论文 “A Parallel Framework for Constraint-Based Bayesian Network Learning via Markov Blanket Discovery” 作为今年SCC复现题基准。“我们需要复现实验结果,并分析与原论文数据间的异同。”团队成员表示:两道应用Cardioid和Q-E都是在超算中心上投入使用很多年的程序,组委会通过赛题,不仅考察了队员的各方面能力,也让我们有机会了解认识到真正的超算中心上都在解决哪些问题。“去年比赛是第一次线上竞赛,我们需要在预算限制下,在 Azure 云服务器上自选机型,搭建高性能集群进行比赛。”不同的是,此次大赛首次提供微软 Azure 云和Oracle云两个云平台供学生进行比赛。学生团队必须优先考虑和利用 Microsoft Azure 云的预算,并且需要了解如何优化和利用Oracle云提供的特定硬件。这对选手来说是一个新的体验。“云服务器的特点在于机型种类多,有不同的软硬件配置。在选择机型时,我们不仅需要在权衡性价比后选择最合适的硬件配置,还要为它们安装正确的软件(如操作系统等),才能发挥出它最高的性能。这要求同学们必须对软硬件有深入的了解。”“在比赛中,我们也遇到了一些资源竞争的问题。开赛后我们才发现,某种高性能机型主办方只提供了8台,甚至不能保证10个队伍各有一台。高性能机型的不足,是我们本次比赛中遇到的最大困难。最终我们调整策略,顺利完成了比赛。”团队成员翟明书、宋泽宇曾参加过ISC21,SC20,ASC21并且取得了很好的成绩。今年队伍中虽有4名同学都是第一次参加,但是他们仍然保持了高水平的发挥。这离不开每个队员赛前的刻苦训练,以及赛中充分的交流协作。“要想把比赛打好,我们需要发挥出每个队员的长处,合理安排比赛策略,在比赛中做到高效交流、冷静判断比赛形势。今年我们做到了这些,也取得了一个好成绩。”虽然清华超算团队已经在SC比赛上取得了四连冠的傲人成绩,在外人看来可能会觉得清华夺冠不是一件特别困难的事情,但事实并非如此。“超算比赛只允许本科生同学参赛,所以我们每年队伍人员变动都不小。SC比赛是每年秋季开学后的第一场超算比赛,对很多超算队队员而言,SC比赛都是他们经历的第一场超算比赛。第一次参赛总是最具有挑战的,想要在比赛中有好的发挥,离不开赛前充分刻苦的训练。”清华的“四连冠”,但对新队员来说是“第一冠”,这绝对不是轻而易举就可以做到的。“我们希望这是一个好的开始,在接下来的ISC等超算竞赛中,争取获得好成绩。”参考链接:
1.https://sc21.supercomputing.org
2.https://studentclustercompetition.us/index.html
雷峰网雷峰网(公众号:雷峰网)