相对于前两年英伟达举办的 GTC(GPU Technology Conference) 来说,今年 GTC 在 GPU 技术架构和硬件创新的进展并不明显。在 Keynote 环节,英伟达创始人兼 CEO 黄仁勋发布了一款定价 99 美元的 Jetson Nano——除此之外,并没有此前预想中的新架构,或者“大核弹”。
尽管如此,在现场见证了 Keynote 之后,雷锋网依然感受到了黄仁勋的激情,以及他在打造基于现有的 GPU 技术的应用生态方面的努力。无论是基于图灵架构和 RTX 技术的 Nvidia Omniverse 和 NVIDIA RTX Servers 服务器,还是七家世界级的厂商将推出基于 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速库的服务器,都让人体会到英伟达在技术应用生态方面的着力。
实际上,黄仁勋依旧在强调这句话:买的(GPU)越多,省的(Money)越多。
在 GTC 大会正式举行的第二天,黄仁勋出现在包括雷锋网在内的媒体参与的 Q&A 环节,他首先重点强调了本次 GTC 的两个核心关键词——Ray-Tracing 和 Data Science,随后回答了众多外界关注的关键问题,比如说未来的 GPU 技术路线、对以色列公司 Mellanox 的收购,数据中心的未来、摩尔定律的终结等。
雷锋网也针对本次 Q&A 的关键内容进行了提取。
在本次 GTC 正式开幕前一周,英伟达宣布了对以色列科技公司收购,这是英伟达历史上以来最大的一笔收购。对此,黄仁勋提到了以下几点:
在摩尔定律放缓的时期,网络软件堆栈必须尽可能转移到架构上,为 CPU 减负;现在,CPU 是一种有限的资源,所以必须尽可能地把工作从 CPU 中减负出来。Mellanox 是 CPU 减负领域的一流企业。
在数据中心中,计算架构不再停留在节点上,而是将扩展到网络。整个网络都将涉及英伟达的 GPU。英伟达有能力与第一大互联技术公司 Mellanox 紧密合作,整个行业非常欢迎它。
英伟达对 Mellanox 收购一案获得监管部门的批准表示乐观,这将使得英伟达加速创新并推进技术发展,以更好地服务于客户。因为我们缺乏网络技术,而我们的目标是推进网络技术,为数据中心节省成本。而英伟达的客户普遍表示支持并乐见其成。
英伟达并不经常收购公司,因为它喜欢与别人合作,而英伟达也是一个开放的平台(比如说 CUDA、DGX),同时英伟达的业务模式必须是开放的。但是之所以收购 Mellanox,是因为双方之间长达 10 年的合作,而英伟达认为 Mellanox 在高速、高性能计算和网络设计方面非常擅长。
英伟达为什么愿意以如此高价进行收购呢?因为 Mellanox 值这个价——这不是成本的问题,而是价值的问题。
本次 GTC 上,英伟达没有推出此前被广泛预测的 7nm GPU 架构,这也引起外界的质疑:在处理技术放缓的情况下,英伟达将如何看待 3D 和堆叠技术?而面的 AMD 已经推出的 7nm CPU,英伟达会否会在 7nm 方面有所动作?
对此,黄仁勋表示:
Tesla V100 已经是处理量最大的 3D 封装硅片,而英伟达也是台积电最大的芯片堆叠客户。事实上,3D 堆叠已经有 5 年的历史了,有些人甚至用它来堆叠手机芯片,这样可以降低封装高度。这种技术已经存在一段时间了,它不是新东西。
但是对于英伟达来说,不仅需要 3D 堆叠,也需要 2D 堆叠。而英伟达实现 2D 堆叠的方法就是 NVLink。英伟达也需要一定规模的数据中心,这不再是为了 2D 堆叠,而是为了提升处理量。为此,英伟达需要通过 Mellanox 来实现,将多个 GPU 与大型计算引擎相连。
未来,数据中心将成为一个巨大的计算引擎,而且数据中心的体积也要不断减小,而计算效果却非常惊人——这需要具备高性能技术方面的专长,也是 Mellanox 擅长的。
而针对外界关注的 7nm 技术和下一代 GPU 的发展,黄仁勋表示:
实际上 7nm 技术已经公开发售,台积电也希望能够卖给我们;我要想买它也非常容易。但是对于英伟达来说,我要考虑的问题是,购买 7nm 的要义和益处是什么?对 NVIDIA 来说,从台积电购买 7nm 处理器技术,并不会让我们成为一家好公司,只会让台积电变得更好。而英伟达的与众不同之处在于,我们在任何时候都能开发最具能效的 GPU,而且利用的是最具成本效益的技术。实际上,我们的工程师也是架构师,他们必须开发最具能效的 GPU,比如 Turing;我们的贡献是兼顾效率与最佳架构——我们为 Turing 选择了最佳的技术,即 12 nm。
对于本次 GTC 来说,最新发布的 CUDA-X 加速库成为一个亮点,同时数据中心和 RTX 技术成为重中之重,GPU 硬件被提及的次数很明显少了很多。当被问及为什么硬件在 GTC 2019 的角色被相对弱化时, 黄仁勋表示:
你之所以会听到很多关于软件的内容,是因为:如果我们不为硬件开发软件,那么硬件将没有用武之地;(正是因为有相应的)软件存在,才使硬件变得出色。如果我们不自己开发软件,那么市场上将只有适用于 CPU 的软件。英伟达的业务是向新市场销售计算机平台,如果我们想这样做,我们必须打造新的软件架构(比如说 CUDA-X)。在这方面没人会帮我们,我必须亲力亲为。
而面对外界对于基于图灵架构的 RTX 市场销售和技术应用情况的质疑,黄仁勋回应称:
RTX 在最初八周内的增长几乎比 Pascal 快50%。然而,人们为什么会觉得 RTX的应用放缓?这是因为当我们首次向市场推出该产品时,我们有加密产品的库存,我们不能推出整个系列——我想这样做,但是不能。现在,我们已推出了整个系列,它们都表现得很出色。
另外,伴随着 RTX 服务器的推出,外界也开始关心 RTX 技术何时能够纳入到 Geforce Now(简称为 GFN)中去并面向公众开放,对此,黄仁勋回应了如下要点:
目前新制造的 GFN 服务器都采用了光线追踪技术。
目前 GFN 的等待名单里有 300000 玩家和 100 万用户。首要挑战是要确保能大规模、高质量地提供这项服务,其次就是必须降低成本,以便减低客户成本,让他们去玩免费的游戏。另外,第三个挑战就是确保 GFN 能够覆盖全球更多的国家,而不仅仅是西方国家。
预计光线追踪将在 2019 年第三第四季度开放。
在本次 GTC 上,以数据中心为载体的数据科学(Date Science)也是黄仁勋谈到的重点内容。当被问及对英特尔最新架构的看法时,黄仁勋表示:
首先我认为英特尔也认识到了加速计算是未来的发展方向。整个行业不再认为 CPU 和 GPU 是互斥的,这当然是件好事,因为那条路已经走不通了。我们要承认,我们需要新的方法去引领行业向前发展。其次,我们仅占全球 HPC 总量的一小部分在全球超级计算机企业(500 强企业)中,英特尔有充分理由占据非常大的份额。英特尔是一家竞争力很强的公司。我期待他们奋勇向前,我们也将积极面对挑战,最后受益的将是全世界的用户和研究人员。第三,我不太确定,英特尔最新架构是设计本身的成功,还是原有技术的延展。但我认为非常好的是,英特尔这个声明基本是在讨论加速计算;它是在说:“来点真格的吧,加速我们的堆栈”。
而关于目前数据中心发展所受的限制,黄仁勋最后表示:
其实很简单,目前对数据中心的唯一限制就是:摩尔定律的终结。我们深知,未来计算负荷呈指数趋势增长。如果摩尔定律已经终结了,唯一的方式将是构建更多的数据中心。我相信,将来的趋势是增加数据中心的工作负荷,这样,数据中心的计算能力将会以 10 倍的速度提升,其结果是:软件创新将会突飞猛涨,计算能力将进一步增强,而这会推动更多的创新。