黄仁勋：数据中心将成为巨无霸，但 AI 加速计算才是未来

黄仁勋数据中心 RTX Mellanox

2019/03/21 09:35

相对于前两年英伟达举办的 GTC（GPU Technology Conference）来说，今年 GTC 在 GPU 技术架构和硬件创新的进展并不明显。在 Keynote 环节，英伟达创始人兼 CEO 黄仁勋发布了一款定价 99 美元的 Jetson Nano——除此之外，并没有此前预想中的新架构，或者“大核弹”。

尽管如此，在现场见证了 Keynote 之后，雷锋网依然感受到了黄仁勋的激情，以及他在打造基于现有的 GPU 技术的应用生态方面的努力。无论是基于图灵架构和 RTX 技术的 Nvidia Omniverse 和 NVIDIA RTX Servers 服务器，还是七家世界级的厂商将推出基于 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速库的服务器，都让人体会到英伟达在技术应用生态方面的着力。

实际上，黄仁勋依旧在强调这句话：买的（GPU）越多，省的（Money）越多。

黄仁勋：数据中心将成为巨无霸，但 AI 加速计算才是未来

在 GTC 大会正式举行的第二天，黄仁勋出现在包括雷锋网在内的媒体参与的 Q&A 环节，他首先重点强调了本次 GTC 的两个核心关键词——Ray-Tracing 和 Data Science，随后回答了众多外界关注的关键问题，比如说未来的 GPU 技术路线、对以色列公司 Mellanox 的收购，数据中心的未来、摩尔定律的终结等。

雷锋网也针对本次 Q&A 的关键内容进行了提取。

一、关于英伟达对于 Mellanox 的收购

在本次 GTC 正式开幕前一周，英伟达宣布了对以色列科技公司收购，这是英伟达历史上以来最大的一笔收购。对此，黄仁勋提到了以下几点：

在摩尔定律放缓的时期，网络软件堆栈必须尽可能转移到架构上，为 CPU 减负；现在，CPU 是一种有限的资源，所以必须尽可能地把工作从 CPU 中减负出来。Mellanox 是 CPU 减负领域的一流企业。
在数据中心中，计算架构不再停留在节点上，而是将扩展到网络。整个网络都将涉及英伟达的 GPU。英伟达有能力与第一大互联技术公司 Mellanox 紧密合作，整个行业非常欢迎它。
英伟达对 Mellanox 收购一案获得监管部门的批准表示乐观，这将使得英伟达加速创新并推进技术发展，以更好地服务于客户。因为我们缺乏网络技术，而我们的目标是推进网络技术，为数据中心节省成本。而英伟达的客户普遍表示支持并乐见其成。
英伟达并不经常收购公司，因为它喜欢与别人合作，而英伟达也是一个开放的平台（比如说 CUDA、DGX），同时英伟达的业务模式必须是开放的。但是之所以收购 Mellanox，是因为双方之间长达 10 年的合作，而英伟达认为 Mellanox 在高速、高性能计算和网络设计方面非常擅长。
英伟达为什么愿意以如此高价进行收购呢？因为 Mellanox 值这个价——这不是成本的问题，而是价值的问题。

二、关于 3D 和堆叠技术、7nm 技术

本次 GTC 上，英伟达没有推出此前被广泛预测的 7nm GPU 架构，这也引起外界的质疑：在处理技术放缓的情况下，英伟达将如何看待 3D 和堆叠技术？而面的 AMD 已经推出的 7nm CPU，英伟达会否会在 7nm 方面有所动作？

对此，黄仁勋表示：

Tesla V100 已经是处理量最大的 3D 封装硅片，而英伟达也是台积电最大的芯片堆叠客户。事实上，3D 堆叠已经有 5 年的历史了，有些人甚至用它来堆叠手机芯片，这样可以降低封装高度。这种技术已经存在一段时间了，它不是新东西。
但是对于英伟达来说，不仅需要 3D 堆叠，也需要 2D 堆叠。而英伟达实现 2D 堆叠的方法就是 NVLink。英伟达也需要一定规模的数据中心，这不再是为了 2D 堆叠，而是为了提升处理量。为此，英伟达需要通过 Mellanox 来实现，将多个 GPU 与大型计算引擎相连。
未来，数据中心将成为一个巨大的计算引擎，而且数据中心的体积也要不断减小，而计算效果却非常惊人——这需要具备高性能技术方面的专长，也是 Mellanox 擅长的。

而针对外界关注的 7nm 技术和下一代 GPU 的发展，黄仁勋表示：

实际上 7nm 技术已经公开发售，台积电也希望能够卖给我们；我要想买它也非常容易。但是对于英伟达来说，我要考虑的问题是，购买 7nm 的要义和益处是什么？对 NVIDIA 来说，从台积电购买 7nm 处理器技术，并不会让我们成为一家好公司，只会让台积电变得更好。而英伟达的与众不同之处在于，我们在任何时候都能开发最具能效的 GPU，而且利用的是最具成本效益的技术。实际上，我们的工程师也是架构师，他们必须开发最具能效的 GPU，比如 Turing；我们的贡献是兼顾效率与最佳架构——我们为 Turing 选择了最佳的技术，即 12 nm。

三、关于软硬件关系、RTX 的技术应用

对于本次 GTC 来说，最新发布的 CUDA-X 加速库成为一个亮点，同时数据中心和 RTX 技术成为重中之重，GPU 硬件被提及的次数很明显少了很多。当被问及为什么硬件在 GTC 2019 的角色被相对弱化时，黄仁勋表示：

你之所以会听到很多关于软件的内容，是因为：如果我们不为硬件开发软件，那么硬件将没有用武之地；（正是因为有相应的）软件存在，才使硬件变得出色。如果我们不自己开发软件，那么市场上将只有适用于 CPU 的软件。英伟达的业务是向新市场销售计算机平台，如果我们想这样做，我们必须打造新的软件架构（比如说 CUDA-X）。在这方面没人会帮我们，我必须亲力亲为。

而面对外界对于基于图灵架构的 RTX 市场销售和技术应用情况的质疑，黄仁勋回应称：

RTX 在最初八周内的增长几乎比 Pascal 快50%。然而，人们为什么会觉得 RTX的应用放缓？这是因为当我们首次向市场推出该产品时，我们有加密产品的库存，我们不能推出整个系列——我想这样做，但是不能。现在，我们已推出了整个系列，它们都表现得很出色。

另外，伴随着 RTX 服务器的推出，外界也开始关心 RTX 技术何时能够纳入到 Geforce Now（简称为 GFN）中去并面向公众开放，对此，黄仁勋回应了如下要点：

目前新制造的 GFN 服务器都采用了光线追踪技术。
目前 GFN 的等待名单里有 300000 玩家和 100 万用户。首要挑战是要确保能大规模、高质量地提供这项服务，其次就是必须降低成本，以便减低客户成本，让他们去玩免费的游戏。另外，第三个挑战就是确保 GFN 能够覆盖全球更多的国家，而不仅仅是西方国家。
预计光线追踪将在 2019 年第三第四季度开放。

四、关于摩尔定律的终结和数据中心的未来

在本次 GTC 上，以数据中心为载体的数据科学（Date Science）也是黄仁勋谈到的重点内容。当被问及对英特尔最新架构的看法时，黄仁勋表示：

首先我认为英特尔也认识到了加速计算是未来的发展方向。整个行业不再认为 CPU 和 GPU 是互斥的，这当然是件好事，因为那条路已经走不通了。我们要承认，我们需要新的方法去引领行业向前发展。其次，我们仅占全球 HPC 总量的一小部分在全球超级计算机企业（500 强企业）中，英特尔有充分理由占据非常大的份额。英特尔是一家竞争力很强的公司。我期待他们奋勇向前，我们也将积极面对挑战，最后受益的将是全世界的用户和研究人员。第三，我不太确定，英特尔最新架构是设计本身的成功，还是原有技术的延展。但我认为非常好的是，英特尔这个声明基本是在讨论加速计算；它是在说：“来点真格的吧，加速我们的堆栈”。

而关于目前数据中心发展所受的限制，黄仁勋最后表示：

其实很简单，目前对数据中心的唯一限制就是：摩尔定律的终结。我们深知，未来计算负荷呈指数趋势增长。如果摩尔定律已经终结了，唯一的方式将是构建更多的数据中心。我相信，将来的趋势是增加数据中心的工作负荷，这样，数据中心的计算能力将会以 10 倍的速度提升，其结果是：软件创新将会突飞猛涨，计算能力将进一步增强，而这会推动更多的创新。