超算TOP500榜单公布，英伟达AI优势前所未有？

超算

作者：吴优

2021/06/29 19:46

本周，一年一度的高性能计算大会ISC如期而至，世界TOP 500超级计算机排名也随之更新公布，对比去年的榜单，今年TOP 10的榜单中，来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统新晋入围。

在TOP500的榜单中，中国超级计算机的数量虽然下降至186台，但对比位居第二的美国的123台，依然遥遥领先。

一个值得注意的事实是，此次榜单中有342套系统采用了英伟达技术提供加速，对比去年的333套提升2%，榜单上使用InfiniBand的系统数量也比去年增加了20%。另外，名单上更新的两个新系统“超级云”，能够同时满足AI、高性能计算（HPC）和云端需求。

这意味着，高性能计算正在同AI加速融合，而在这一融合趋势下，英伟达在超算领域的优势前所未有。

不止是TOP10中的8台，新晋系统也选英伟达

雷锋网此前在《全球TOP10超级计算机8台都选英伟达的三大原因》一文中分析过，由于高速数据互连技术的普及，以及英伟达GPU系统能够提高将超算的能效提升2.8倍，全球TOP10超级计算机中的8台都采用了英伟达GPU或InfiniBand网络技术。

在最新公布的榜单中，不少新晋系统也都选择英伟达提供支持，其中包括云端的两个新系统。

Microsoft Azure是其中之一，在TOP 500榜单上连续占据第26位到第29位，利用集群将公有云服务提升到新的水平。作为新兴的共享超级计算机，地球上的任何用户都可以按需使用。

在Azure系统的背后，有8个NVIDIA A100 Tensor Core GPU为其各个虚拟实例提供动力支持，每个芯片都有自己的HDR 200G InfiniBand 通信接口，可以与Azure云中的数千个GPU建立高速连接。

剑桥大学的新系统Wilkes-3是另一个超级云系统，也是世界上第一台云原生超级计算机。该系统使用了320个连接在HDR 200G Infiniband 网络上的 A100 GPU，且有经过优化的NVIDIA BlueField DPU提供安全、虚拟化的数据处理，保证虚拟资源的隐私性和安全性。

此外，本次进入TOP10的新系统Perlmutter，以 64.59 Linpack petaflops 在 TOP500 中排名第 5，也是由来自英伟达6144个A100GPU提供动力支持。

国家能源研究科学计算中心 (NERSC) 数据和分析服务组代理负责人 Wahid Bhimji 表示：“AI是美国能源部的一个增长领域，其可行性已被验证，正计划投入生产。”

英伟达更新超算平台，加入三项关键技术

为了持续满足高性能计算对AI的需求，英伟达也在本次ISC大会上发布全新的HGX A100系统，且已经在英国爱丁堡大学托管的DiRAC超级计算机中落地。

英伟达HGX A100加入了三项关键技术：NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 网络和 NVIDIA Magnum IO GPUDirect Storage 软件。

超算TOP500榜单公布，英伟达AI优势前所未有？

其中，A100 80GB PCle GPU采用NVIDIA Ampere架构，与A100 40GB相比其内存带宽带到2TB/S，提升25% 。更高的内存容量和内存带宽，能够将更多的数据和更大的神经网络保存在内存中，从而最大限度地减少节点通信和能耗，研究人员也能获得更高的吞吐率和更快的结果。

在网络方面，英伟达并购Mellanox后，释放 InfiniBand高效网络潜能。InfiniBand 作为全球唯一具有完全负载转移功能的网络内计算互连系统，英伟达为此配备了NVIDIA Quantum-2固定配置交换机和模块化交换机。

NVIDIA Quantum-2 模块化交换机最高可提供 2048 个 NDR 400Gb/s InfiniBand 端口（或 4096个 NDR200 端口）的可扩展端口配置，双向总吞吐量达到每秒 1.64 PB，是上一代 HDR InfiniBand 模块化交换机系列的5倍。

NVIDIA Quantum-2 交换机具有向前和向后兼容的特性，可以轻松迁移和扩展现有的系统和软件。

在软件方面，Magnum IO GPUDirect Storage软件提供了GPU内存和存储之间的直接内存访问，能够实现复杂工作负载处理性能。英伟达称，应用程序通过直接路径从低 I/O 延迟中受益并能够使用网络适配器的全部带宽，同时减少 CPU 的利用负载并管理数据消耗增加所产生的影响。

目前，英伟达最新HGX高性能计算平台已落地英国爱丁堡大学，为其托管的新型DiRAC超级计算机Tursa提供动力支持。

爱丁堡大学的 Peter Boyle 教授对HGX所提供的支持表示肯定：“Tursa 旨在应对独特的研究挑战，为科学建模和仿真解锁新的可能性。NVIDIA 加速计算平台提供超大规模服务，通过精确平衡网络带宽和FLOPS 来以实现这项研究所需的出色性能，进而助力新发现。”

几十年前，学术研究中心尝试模拟原理的相互作用，吸引了航空航天、医疗健康等多个行业的注意，但其所需要的巨量计算阻碍了发展研究，直到加速计算和深度学习的出现，才使得高性能计算落地得以推进。

“得益于各种进步，我们正处于高新能计算革命的开端。”黄仁勋如此评价当下高性能计算的发展。

雷锋网雷锋网