英伟达SC24六大技术亮点，不止加速超算500强

英伟达 CUDA SC24

2024/11/21 19:13

雷峰网(公众号：雷峰网)消息，当地时间11月18日，TOP500组织于SC24大会（2024年超级计算大会）上正式公布了最新的全球超级计算机TOP500榜单，在这500个全球最强的计算机系统中有384个采用了英伟达的技术，其中前十名中更是占据了八个席位。

黄仁勋表示：“自CUDA诞生以来，英伟达将计算成本降低至之前的百万分之一。对一些人来说，英伟达就像一台计算显微镜，让他们能够观察到极其微小的东西；对另一些人来说则像一台望远镜，让他们能够探索难以想象的遥远星系；对许多人来说，它是一台时间机器，让他们能够在有生之年从事毕生的事业。”

但英伟达的目标不止于此。

SC24大会上，英伟达发布和开源了多项新产品，包括加快数据处理的cuPyNumeric、生物医药开源框架BioNeMo、NVIDIA ALCHEMI NIM微服务、气候预测平台Earth-2 NIM、CUDA-Q平台以及实现数字孪生的Omniverse Blueprint，为学术界和产业界提供更多支持，推动量子计算、药物发现以及新材料研究等尖端科研发展。

持续加速最前沿科研和行业应用，让英伟达保持高性能计算领域的绝对王者。

加速前沿科研的新选择

发布cuPyNumeric，“无痛”加速科研

科学研究需要对大量数据进行处理分析，处理数据的速度越快，科学家们就能越快地针对有前景的数据点、值得研究的趋势以及实验调整做出决策。

cuPyNumeric是一个加速计算库，其发布为科研带来两个好处：一是通过扩展强大的计算集群，提高数据处理效能；二是该功能无需修改Python代码，科研人员不需要掌握计算机科学方面的专业知识，减少学习成本。

英伟达SC24六大技术亮点，不止加速超算500强

此前，许多科学家都在使用NumPy程序，并仅在一个CPU节点上运行，这限制了其算法的吞吐量，无法处理电子显微镜、粒子对撞机和射电望远镜等仪器收集的日益庞大的数据集。

通过提供一个可扩展到数千个GPU的NumPy替代品，cuPyNumeric从单个GPU扩展到整个超级计算机，可以更快地处理大量数据。

关于计算机专业知识方面，科研人员只需使用熟悉的NumPy界面编写代码，或将cuPyNumeric应用于现有代码，即可体验到高性能和可扩展性。

SLAC国家加速器实验室、洛斯阿拉莫斯国家实验室、澳大利亚国立大学、马萨诸塞大学波士顿分校、斯坦福大学湍流研究中心和印度国家支付公司等机构的科研人员均集成了cuPyNumeric，从使用体验来看，显著地改善了他们的数据分析工作流程。

BioNeMo开源框架，为药物研发打上“肾上腺素”

BioNeMo通过结合加速计算以及提供更大的开源数据集，推动生物医药产业发展。

英伟达SC24六大技术亮点，不止加速超算500强

加速计算为研究人员提供趁手的工具，而开源数据集则补足了“原料”。

研究人员需要专门的生物分子模型和数据集来大规模地收集洞察，以便更快地设计治疗方案。开源BioNeMo框架提供了一系列加速计算工具，为生物分子研究提供指数级扩展的AI模型，也为生物制药领域带来新的超级算力水平。

英伟达医疗健康与生命科学总经理兼副总裁Kimberly Powell表示：“最近的诺贝尔化学奖证明了AI、加速计算和日益扩大的数据集的融合为制药行业创造了前所未有的机遇。为了帮助解开生物系统的复杂奥秘，我们推出了BioNeMo开源框架，它将使全球各地的研究人员能够更快开发出挽救生命的治疗方法。”

BioNeMo已被产业及学术界大量采用，包括A Alpha Bio、美国阿贡国家实验室、Dyno Therapeutics、罗氏集团的成员基因泰克及Ginkgo Bioworks等。

阿贡国家实验室计算科学小组负责人Arvind Ramanathan表示：“美国阿贡国家实验室贡献了数十亿参数的生物模型，这些模型需要使用专门的软件在高性能计算环境中训练而成。BioNeMo为美国阿贡国家实验室和更广泛的生物技术社群提供了一个企业级开源解决方案，使研究人员能够在本来不具备足够的计算专业知识的实验室中，轻松扩展大型生物基础模型的训练规模。”

除此之外，英伟达还发布了适用于BioNeMo的一系列NIM微服务（容器化的GPU加速推理服务，可用于预训练和自定义AI模型）。这些微服务可以快速、轻松地部署在本地或任何数据中心或云中，使开发人员能够在各种不同的环境中灵活运行应用，并缩短了生物药物研发研究中从推理到获得洞察的时间。

新推出的NIM微服务支持业界领先的模型，包括谷歌的AlphaFold2及麻省理工的DiffDock 2.0。目前已有200多家科技生物公司、大型制药公司和初创企业用户将BioNeMo集成到其计算机辅助药物研发平台和工作流中。

NVIDIA ALCHEMI让新材料发现，从「混乱走向秩序」

据国际金融公司（IFC）报告显示，从洗衣粉、食品包装等日用品到半导体、电池和太阳能电池板等先进工业零部件，超96%的制成品所依赖的化学物质都无可替代，因此，创造新材料以应对储能和环境修复问题变得日益严峻。

但在探索海量的潜在材料时，会涉及到几乎无限种的化学物质组合，这使探索过程极复杂且需要耗费大量时间。在传统实验室中，通常需要进行费力、反复的试错合成和测试才能发现新材料。

AI推理或许是解药。最近，AI 已经成为加快化学物质和材料创新的催化剂。

英伟达发布NVIDIA ALCHEMI NIM微服务，通过优化针对化学模拟的AI推理，加速研究工作，从而催生更高效且可持续发展的材料，从而支持可再生能源转型。

英伟达SC24六大技术亮点，不止加速超算500强

SES AI是领先的锂电池开发商，正在使用NVIDIA ALCHEMI NIM微服务和AIMNet2模型，致力于更快地找到制造电动汽车所需的电解质材料。

借助ALCHEMI，SES AI近期在半天时间内绘制了10万个分子，而且有望把绘制时间缩短到一小时内。

Earth-2 NIM让「模拟地球」的速度提高500倍

Earth-2是一个数字孪生云平台，用于模拟并可视化呈现天气和气候条件。

英伟达SC24六大技术亮点，不止加速超算500强

彭博社报告显示，2024年上半年，自然灾害造成的保险损失约为620亿美元，较近10年平均值高出了70%左右。

SC24大会上，英伟达发布了两项基于Earth-2的全新微服务，为气候技术应用提供商提供了领先的生成式 AI 驱动的功能，以辅助预测极端天气事件，且将气候变化模型的模拟计算速度提高了500倍。

两项微服务：更高分辨率建模的CorrDiff NIM及使大规模集合预报成为可能的FourCastNet NIM。

CorrDiff是一种可实现公里尺度超高分辨率的生成式AI模型。CorrDiff基于WRF模型的数值模拟结果进行训练，可以生成12倍更高分辨率的天气预报结果。

与使用CPU的传统高分辨率数值天气预报相比，CorrDiff NIM微服务的计算速度高出了500倍，能效提升了10000倍。此外，CorrDiff 现在以300倍的更大规模运行，可对整个美国进行超分辨率处理（即提高低分辨率图像或视频的分辨率），并能以公里尺度的可见度预测降雪、结冰和冰雹等降水事件。

但并非每个用例都需要高分辨率预报。对某些应用来说，使用粗分辨率的大规模集合预报反而能获得更好效果。

FourCastNet NIM微服务提供了全球范围的中期粗分辨率预报。通过使用欧洲中期天气预报中心或美国国家海洋和大气管理局等业务气象中心的初始场，提供商可生成未来两周的预报，速度比传统数值天气模型快5000倍。

这为气候技术提供商带来了新机遇，使其能够以不同尺度评估极端天气相关风险，从而预测当前计算工作流对低概率事件发生可能性的遗漏。

与产业巨头强强联合

英伟达CUDA-Q携手谷歌Quantum AI，加速量子计算处理器设计

SC24大会上，英伟达宣布与谷歌达成合作，谷歌旗下的Quantum AI将采用CUDA-Q平台进行模拟，以加速下一代量子计算器件的设计工作。

英伟达SC24六大技术亮点，不止加速超算500强

英伟达CUDA-Q是一个开源量子平台，协调了运行大规模量子计算应用程序所需的硬件和软件。谷歌旗下的Quantum AI致力于构建量子计算机，通过量子计算解决其他方法无法解决的问题。

现阶段，量子计算由于存在硬件的局限性，只能运行一定数量的运算，该现象被研究人员称为“噪声”。

谷歌量子AI正在使用量子-经典混合计算平台和NVIDIA Eos超级计算机，以模拟其量子处理器的物理特性，这将有助于克服量子计算硬件当前的局限。

谷歌量子AI研究科学家Guifre Vidal表示：“要想开发出商用的量子计算机，就必须能够在控制噪声的情况下扩展量子硬件规模。借助英伟达加速计算，我们正在探索越来越大的量子芯片设计中噪声的影响。”

过去，模拟的计算成本非常高。借助CUDA-Q平台，谷歌可以在NVIDIA Eos超级计算机上使用1024个NVIDIA Hopper Tensor Core GPU，以低成本进行世界上最大、最快的量子器件动态模拟。

英伟达量子和高性能计算总监Tim Costa表示：“强大的AI超级计算有助于量子计算取得成功。谷歌对CUDA-Q平台的使用展现了GPU加速的模拟在推进量子计算方面发挥的作用，它将帮助解决许多问题。”

借助CUDA-Q和Hopper GPU，谷歌可以对包含40个量子比特的器件进行模拟，是同类模拟中规模最大的，噪声模拟时间从一周缩短到几分钟。

实现万物「数字孪生」的“蓝图”

Omniverse Blueprint是一款物理数字孪生产品，数字孪生是物理实体的精准虚拟模型，通过实时数据采集和仿真分析，为决策提供支持。

Blueprint是一个包含NVIDIA加速库、物理AI框架以及基于物理学的交互式渲染的参考工作流，可将仿真和实时可视化速度提高1200倍。

英伟达SC24六大技术亮点，不止加速超算500强

黄仁勋表示：“我们构建Omniverse是为了让万物都能拥有数字孪生。Omniverse Blueprint是打通NVIDIA Omniverse与AI技术的参考管线。借助该蓝图，领先的CAE软件开发商能够构建出开创性的数字孪生工作流，为全球各大行业实现从设计、制造到运营的工业数字化转型。”

Altair、Ansys、Cadence、西门子等软件开发商利用NVIDIA Omniverse Blueprint实现实时计算机辅助工程数字孪生，帮助客户在降低开发成本和能耗的同时，更快进入市场。

构建实时物理数字孪生系统需要两项基本功能：实时物理求解器的性能与大规模数据集的实时可视化。

Omniverse Blueprint为开发者统一三大技术支柱：用于加速求解器的NVIDIA CUDA-X 库、用于训练和部署模型以生成流场的NVIDIA Modulus物理AI框架，以及用于3D数据互操作性和RTX支持的实时可视化的NVIDIA Omniverse API来实现上述两项基本功能。

工程仿真软件Ansys在Texas Advanced Computing Center的320颗NVIDIA Grace Hopper超级芯片上运行Fluent，仅用六个多小时就完成了25亿个单元的汽车仿真，而在2048颗x86 CPU Core上运行这一仿真则需要近一个月的时间。

Ansys总裁兼首席执行官Ajei Gopal表示：“我们通过将NVIDIA Omniverse Blueprint与Ansys软件集成，使客户能够更加快速、准确地进行日益复杂和详细的仿真，我们的协作正在推动多个行业的工程与设计发展。”

此外，Omniverse Blueprint还可在所有领先的云平台上运行，包括亚马逊云科技、Google Cloud，Microsoft Azure和Oracle Cloud Infrastructure。

Rescale是一个基于云的平台，可以帮助企业加速科学和工程突破。通过使用NVIDIA Omniverse Blueprint，该平台上的企业只需点击几下即可训练和部署自定义AI模型。

2024年超级计算大会将落幕，但英伟达在加速计算的路上仍在不断加速。