NVIDIA 创始人兼首席执行官黄仁勋在COMPUTEX 2024开幕前,面向现场6500多名观众的演讲,最引人注意的就是最新的产品路线图。
黄仁勋展示了未来三年的产品路线图,并首次公布下一代平台Rubin。
看起来,黄仁勋将NVIDIA产品的更新节奏推向了技术的极限,近些年有类似节奏的公司是以消费市场为主的苹果,这表达了NVIDIA“加速一切”决心的同时,也预示着AI应用蓬勃发展的阶段即将到来。
GPU架构、网络平台Spectrum-X每年更新的同时,NVIDIA也在推动加速计算成本的降低、有降低AI应用门槛的NIM推理微服务,以及推动AI新一波浪潮的机器人等。
可以越来越清晰的看到,NVIDIA要成为AI世界里的基石。
黄仁勋还给出预测,AI新一波浪潮是物理AI。
GPU、以太网网络平台每年更新
黄仁勋COMPUTEX 2024开幕前的演讲,首次披露今年发布的Blackwell架构的继任平台Rubin。
Rubin平台将配备新 GPU、基于 Arm 的新 CPU — Vera,以及采用 NVLink 6、CX9 SuperNIC 和 X1600、并融合 InfiniBand/以太网交换机的高级网络平台。
根据NVIDIA的路线图,2025年推出Blackwell Ultra GPU(8S HBM3e 12H);2026年推出Rubin GPU(8S HBM4);2027年推出Rubin Ultra GPU(12S HBM4)。
Rubin和Vera的命名均源自美国天文学家Vera Rubin。
“我展示的所有芯片都在百分之百在开发中。”黄仁勋说,“NVIDIA的更新节奏以年为单位,所有架构都是兼容的,以一年为周期,我们把所有东西推向技术极限。”
黄仁勋称以年为单位更新的基本理念非常简单,打造数据中心规模,以每年的节奏分步骤实现、并向客户交付产品,在各个领域实现技术突破。
同样计划每年推出新产品的还有Spectrum-X产品。NVIDIA Spectrum-X 是全球首款专为 AI 打造的以太网网络平台,可将网络性能较传统以太网网络平台提升1.6倍。
Spectrum-X 为客户提供更高的带宽、更多的端口、更加强大的软件功能集与可编程能力,不断提高领先的AI以太网网络性能。
网络和存储越来越成为限制AI发展的瓶颈。
NVIDIA网络高级副总裁Gilad Shainer说:“生成式 AI 等开创性技术的飞速发展,使每家企业都必须把网络创新放在第一位,从而获得竞争优势。
Spectrum-X配备NVIDIA Spectrum SN5600以太网交换机和NVIDIA BlueField -3 SuperNIC,是一个兼顾了生成式 AI 云所需高性能和各种云功能的端到端平台。
雷峰网(公众号:雷峰网)了解到,率先采用NVIDIA Spectrum-X的AI云服务提供商有CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global 和 Yotta 等。
另外,戴尔科技、慧与、联想和超微等之后,又有多家NVIDIA 合作伙伴也发布了基于 Spectrum 的产品,包括永擎电子(ASRock Rack)、华硕(ASUS)、技嘉科技(GIGABYTE)、鸿佰科技(Ingrasys)、英业达(Inventec)、和硕(Pegatron)、云达科技(QCT)、纬创(Wistron)和纬颖科技(Wiwynn)等。
MGX和NIM降AI应用的软硬件门槛
身处2024年更应该意识到,AI的发展不仅需要GPU、CPU、网络等关键组件,更需要一个易用且低成本的AI系统。
NVIDIA 正在降低将数据转化为智能的成本。
“买的越多,省的越多。”黄仁勋说,CPU的性能扩展已经大大放缓,NVIDIA通过GPU+CPU组合,实现了高达100倍的加速,同时功耗仅增加到3倍,成本仅增加到1.5倍,每瓦性能比单独使用CPU提高25倍。
有更加直观的数据,8年内NVIDIA AI算力增加了1000倍,带来的显著收益是,比如训练1.8万亿参数、8万亿token的GPT-4,所需能耗从8年前Pascal架构的1000GWh减少到Blackwell的3GWh,能耗仅为8年前的1/350。
生成Token的能耗,Blackwell架构降至8年前Pascal架构的1/45000。
用Pascal产生1 Token的能耗相当于2个200W灯泡运行2天,而现在1 Token只用0.4J能耗。
MGX降低AI工厂建立成本和时间
架构演进带来的优势最终还是需要以系统应用的方式呈现,并且要以足够低的软硬件门槛。
为了加快不同规模和配置的系统开发,NVIDIA推出了MGX模块化参考设计平台,以便计算机制造商能够以快速且低成本的方式构建超过 100 种的系统设计配置。
制造商首先可根据其服务器机箱选择一种基本的系统架构,然后再根据不同的工作负载选择 GPU、DPU 和 CPU。通过采用 MGX,开发成本大幅降低,较之前最多降低了四分之三,开发时间缩短到仅六个月,较之前减少了三分之二。
目前,已有超过 25 家合作伙伴的 90 多套已发布或正在开发中的系统使用了 MGX 参考架构。AMD和英特尔也都支持MGX 架构,并首次计划打造基于他们自己 CPU 主机处理器的模块设计。
“新一轮工业革命已经开始。众多企业和地区正在与 NVIDIA 合作推动价值万亿美元的传统数据中心向加速计算转型,并建造一种新型数据中心——AI 工厂来生产新的商品:人工智能。“黄仁勋宣布,NVIDIA MGX模块化参考设计平台加入了对 NVIDIA Blackwell 产品的支持,包括全新 NVIDIA GB200 NVL2 平台,这些系统搭载 Grace CPU 以及 NVIDIA 网络和基础设施,将帮助企业建立 AI 工厂和数据中心。
NIM让2800万开发者轻松创建AI应用
有了AI工厂和数据中心,就拥有了激发AI创新的硬件基础。
每个企业都希望在其运营中融入生成式 AI,但并非每个企业都拥有专门的 AI 研究团队。
NVIDIA给出的解决方案是NIM,这是一种推理微服务,通过经优化的容器的形式提供模型——以部署在云、数据中心或工作站上。
借助 NVIDIA NIM,开发者能够轻松地为 Copilots、聊天机器人等构建生成式 AI 应用,所需时间从数周缩短至几分钟,NVIDIA宣布全球2,800 万开发者已经可以下载 NVIDIA NIM。
NIM能帮助企业实现基础设施投资的效果最大化。例如,与未使用 NIM 的情况相比,在NIM中运行Meta Llama 3-8B所能生成的加速基础设施AI Token可以提升3倍。
据悉,从Meta Llama 3开始,在Hugging Face上现已开始提供 NIM,NVIDIA已经在 Hugging Face上发布了全面优化的Llama 3。
通过基于 NVIDIA GPU 的 Hugging Face 推理端点,只需点击几下,开发者就能在其选择的云平台上轻松地访问和运行 Llama 3 NIM,能有效降低开发AI应用的门槛。
企业可以使用 NIM 来运行用于生成文本、图像和视频、语音以及数字人的应用。借助面向数字生物学的 NVIDIA BioNeMo NIM 微服务,研究人员可以构建新的蛋白质结构,加速药物研发。
目前Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家NVIDIA的技术合作伙伴正将NIM集成到他们的平台中,加快生成式AI部署到特定领域应用中的速度,例如Copilots、代码助手、数字人虚拟形象等。
价值50万亿美元的工业数字化变革
AI将带来的变革,触手可及的是AI PC。
搭载RTX技术的NVIDIA RTX AI PC将通过200多款RTX AI笔记本电脑和500多款采用 AI 技术的应用和游戏改变消费者的体验。
NVIDIA还发布了搭载RTX的AI助手技术演示G-Assist 项目,展示了针对PC游戏和应用的上下文感知辅助功能。
除了消费级市场,NVIDIA也将目光放到了价值 50 万亿美元的工业数字化变革。
面对各行各业采用自主运营和数字孪生,通过虚拟模型提高效率并降低成本对需求。NVIDIA 通过其开发者计划提供对 NIM 的访问权限,以促进 AI 创新。
黄仁勋展示了Foxconn利用NVIDIA Omniverse、Isaac 和 Metropolis 创建数字孪生,通过结合视觉AI与机器人开发工具来实现增强的机器人设施。
“AI新一波浪潮是物理AI。AI能够理解物理定律,并与人类并肩作战,”黄仁勋他强调了机器人和人工智能在未来发展中的重要性。
如今大多数AI并不理解物理定律,不以物质世界为基础。而生成图像、视频、3D图形和许多物理现象,需要基于物理并理解物理定律的AI。
“机器人和物理 AI 正在成为现实,而不仅是出现在科幻小说。这真的令人兴奋,”黄仁勋补充。
NVIDIA Isaac平台为开发者构建 AI 机器人提供强大的套件,包括由AI模型以及Jetson Orin、Thor 等超级计算机驱动的AMR、工业机械臂和人形机器人。
“机器人将遍布所有工厂。工厂将实现对机器人的统筹,而这些机器人将制造新的机器人产品,”黄仁勋同时强调NVIDIA Isaac 在提高工厂和仓库效率方面的作用,比亚迪电子、西门子、泰瑞达、Intrinsic 等全球领先企业都在使用 NVIDIA Isaac 的高级程序库和 AI 模型。
从核心组件到整个AI系统,NVIDIA已经成为加速AI发展的基石。
同时,NVIDIA给出了AI新一波浪潮是物理AI也传递出NVIDIA对于未来的判断与引领。雷峰网