生成式AI的火爆,吸引了大量人开始挖掘AI的金矿。生成式AI模型所需的算力,每100天就要翻一倍,AI对“芯经济”的推动作用非常显著。
“芯经济(Tech Economy)”是英特尔公司首席执行官帕特·基辛格(Pat Gelsinger)近日在2023英特尔on技术创新大会上提出的概念,指的是芯片和软件的推动下,正在不断增长的经济形态。
AI代表着新时代的到来,AI正在催生全球增长的新时代,特别是AI推动的芯经济。
几乎所有芯片公司在AI芯经济面前,面临着一个共同的问题:如何挑战英伟达?
2023英特尔on技术创新大会期间,雷峰网和全球少数媒体一起,和帕特·基辛格面对面聊聊与英伟达的竞争以及英特尔的AI优势。
英特尔公司首席执行官帕特·基辛格(Pat Gelsinger)
作为英伟达创始人黄仁勋35年的老朋友,基辛格没有回避这个问题,他重点谈论了软件。
“我们正在推动的一个简化工作(oneAPI),就是创建一个可编程的中间层,以抽离出所有独特的硬件元素,这起到了两个关键作用。”基辛格进一步解释。
有些工作流需要在CPU上运行,有些需要在GPU上运行,有些需要在专用加速器上运行,还有一些需要在边缘设备上运行,它们的功耗可能只有10瓦。另一方面,大型数据中心的功耗可能高达10兆瓦。
这些情况差异很大,大家都希望有一个合理的跨架构软件堆栈兼容性,这是一个行业趋势。整个行业都在付出巨大的努力,以创建稳定的中间表示语言,使其在多个架构上具备兼容性。
“我们积极参与并确保我们的硬件符合这种表示语言,并提供堆栈支持。希望推动行业的进一步发展。”基辛格同时说,“我们不希望开发者一直在内核级别进行编程,而是能够把时间花在更高层次的工作上。我们致力于提供适合这个新的软件编程市场的硬件产品。”
基辛格重点谈论的软件生态,正是英伟达在AI领域最坚固的护城河。他谈论英特尔统一的跨架构编程平台oneAPI,实际上也是在分享英特尔如何构建一个强大的AI生态挑战英伟达。
作为后来者,英特尔显然需要为oneAPI投入更多的资源,也需要数年壮大oneAPI的生态,才能和对手一战。好的方面是,oneAPI更加开放,这有希望借助更多人的智慧更快建立强大的AI生态。
自己建设一个AI生态,其实是最难的选择,但这也是超越强大的对手唯一可行的路径。相比之下,不少公司选择兼容英伟达的AI生态,这确实降低了不少难度,但也很难超越。
生态建设是一个长期的工作,能够更快直接与英伟达竞争的是性能更高的芯片,英特尔是否也把握住了趋势?
“随着AI模型变得更大,短期内市场需求也更大,最终AI和高性能计算将融为一体。”基辛格同样看到了高性能AI芯片市场的趋势。
同样看到这个趋势的英伟达和AMD,都在今年推出了融合GPU和CPU的产品,作为全球少有的能够设计出同类产品的英特尔,预计要2025年才能有同样定位的产品。
在2025年新产品推出之前,英特尔又如何与英伟达竞争?
“我会说,通过提供更好的产品,我指的是GPU。”基辛格说,“Ponte Vecchio GPU和GPU Flex系列等产品更具可编程性。”
当下英特尔更加强调Gaudi,这也是英特尔进攻AI市场核心的关键。
“我们正在打造最优秀的AI加速器,对于某些用例来说,它并不具备全部的GPGPU可编程性。但是,它符合大语言模型、稳定扩散和核心模型等领域的需求。我们产品的性能基准是英伟达H100的1.4倍,相当不错。”基辛格也进一步解释了Gaudi的优势。
Gaudi在性能、总体拥有成本(TCO)、性能成本比、功耗等特性方面,非常有竞争力。虽然它不是适合万事万物,但它适用于大部分AI工作负载的中间部分。
基辛格非常清楚在当下的AI竞争环境下,Gaudi是英特尔最有力的武器,强调性能、TCO和适用大部分AI工作负载总能打动一些客户。
Gaudi与英伟达竞争的方式,对于中国不少AI芯片公司具备参考价值。因为许多中国的AI芯片初创公司也都是AI专用加速芯片。
当然,还是不能忘了软件的重要性,Gaudi的工程师团队还必须完成所有的软件工作,这样客户才能够轻松地进行模型训练、推理等工作。
采用7nm制程的Gaudi2已经被客户采用,英特尔将在2024年推出5nm的Gaudi3,接下来会是代号为Falcon Shores的融合产品。
不过对于英特尔能否按照产品路线图上的时间推出Falcon Shores,外界存在担忧,他们对于英特尔的执行力持有悲观的态度。
让英特尔重新拥有强大的执行力也是基辛格上任两年半时间工作的重点。
“我们正在重建‘格鲁夫式的执行力’文化。”基辛格说,“重点用数据说话并关注工程问题。我们会花1分钟互相鼓励,然后在剩下的59分钟内把问题解决得更好。”
雷峰网(公众号:雷峰网)了解到,基辛格采取了非常多措施重建纪律、执行力、工程、卓越、以数据为中心的文化。
其中包括重新启动了按节奏推进、管控风险的开发流程,现在称之为Tick Tock 2。重新采用了英特尔发明的OKR,即“目标-关键结果”,并将其重新定义为小组和管理团队之间跟踪绩效和工作联动的独特模式。
基辛格还举了一个提升英特尔效率的例子,这与他上任之后就提出的IDM2.0战略息息相关。
英特尔的产品部门过去常比较随意地要求生产制造部门进行流片生产,芯片的制造非常昂贵,但没有相关的成本计算方式,损害了制造效率。
现在,英特尔的产品部门要为芯片流片生产付费,这使他们会变得更加谨慎,不会把每个设计都送到工厂,而是要仔细验证来确保产业设计过关。
这样做不仅能让英特尔的产品部门更加严谨,使工厂的运作更加高效,极大地提高工厂的生产能力,降低每批次的成本。
“改变需要一段时间,才能实现有条不紊,并在公司上下保持一致。”基辛格非常清楚,兑现了承诺,实现了目标,大家才会相信英特尔,然后可以开始新的布局。
这样看来,产品路线图上的时间点是检验英特尔执行力和创造力非常好的标尺。
当然,谈论AI还不能忘记边缘和终端的AI,这是英特尔的优势所在。
“AI正朝着从云原生开发转向边缘人工智能原生开发的方向前进。我们可以花 10 亿美元创建一个数万亿参数的模型。但如何让数亿人使用它呢?这不应该仅是通过访问云去实现的,而是要把它推向客户端和边缘。在这些领域,我们在技术和产品方面有很大的机会。”基辛格这样认为。
英特尔在2023英特尔on技术创新大会上预览了首款面向AI PC的处理器酷睿Ultra处理器(产品代号Meteor Lake),这是首款集成神经网络处理器(NPU)的酷睿产品。
“我认为会出现独立的NPU,就像出现了独立的GPU一样。尤其在AI PC的早期阶段,人工智能加速器是独立的。”基辛格进一步分享,“显卡可能是唯一一个在可持续时间内独立存在的类别,其他类别则大多数随着时间的推移逐渐融入到平台中。”
但未来NPU到底是融合到基础平台还是成为独立的芯片类别?
“对此我不太确定。但考虑到GPU和NPU在图形领域之间的关联,我们几乎可以想象会存在GPU和NPU二合一的独立芯片。”这是基辛格给出的回答。
AI PC是一个充满吸引力的概念,但能否如基辛格所畅想的一样,可以等待今年12月14日AI PC处理器发布后再进一步观察。
与基辛格的小型采访持续了一小时时间,他非常坦诚地谈论了关于他的领导力,英特尔的执行力,英特尔在AI竞争力以及在制造方面面临的挑战及进展。
就像基辛格对于英特尔完成看起来不可能的任务“四年五个节点”充满了信心一样,他对于英特尔重回领导地位也充满信心,这种信心和实际行动,也正在感染越来越多英特尔的员工。