作者|包永刚
2024年2月1日,英特尔数据中心人工智能事业部迎来了新任总经理Justin Hotard。
从慧与科技(HPE)来到英特尔,Justin的压力不小。
他既要面对AMD和Arm用更先进的制程、更多核心,更多的PCIe抢夺英特尔在服务器CPU市场的份额。还要和如日中天的英伟达竞争,以保证英特尔在生成式AI时代的竞争优势。
在上任四个月后,Justin首次到访中国,各地拜访客户,“希望通过沟通了解他们的需求,在未来继续打造实现双赢的产品。”Justin也在此次中国行中,首次接受了媒体访谈。
这次与雷峰网的对话,Justin谈到了应对服务器CPU市场的竞争,以及与英伟达在AI市场差异化竞争的策略,也就是英特尔的守与攻。
随着今年至强6能效核和性能核产品的推出,英特尔将有理由让客户对其再次充满信任。
会如期推出的至强6+Gaudi3的产品组合,将是英特尔撬动巨大的生成式AI市场的组合拳。
而开放生态,将会是英特尔拿下AI市场最强大的武器。
这个曾经让英特尔坐上PC市场头把交椅的武器。这一次,能够帮助英特尔在AI市场获取多大的成功?
开放的生态系统才能实现无处不在的AI
所有人都担心被AI时代落下,但现在并不需要为此焦虑,市场和技术都未到达成熟的拐点。
市场研究机构预测,超过80%的企业会部署生成式AI,而他们在生成式AI上的支出,在全球将超过1400亿美元。
现在大部分企业还没有做好使用生成式AI的准备,这里有多重因素,比如企业的数据不符合生成式AI的格式;另外,数据分散存储在不同的地方也是问题;还有对数据安全等方面的担忧。
“英特尔推动AI无处不在和企业AI发展的关键,就是要打造一个开放的生态系统,这跟此前我们在互联网时代所采取的策略有异曲同工之妙。”Justin进一步表示,“我们提出的这一策略涵盖不同产品线,包括PC端、边缘侧、数据中心等广泛的产品。”
打造开放的生态系统,底层的硬件是基础。
五年前,AI工作负载主要在虚拟存储,或是对服务器端存储、核心密度等有一定的要求。
现在,内存容量、内存带宽、CPU和GPU之间的互连、GPU之间的互连,以及在不同节点之间实现网络互连都变得更加的重要。
“这对英特尔意味着两点。”Justin说,“第一,必须要有一种全局观,我们的工作要建立在整个系统、整个机架、以及整个数据中心的基础之上,要涵盖所有的解决方法,而不是只单纯从CPU或加速器的角度思考问题。另一方面,客户需要开放的接口,以及具有互操作性。”
在谈论从全局观的视角构建系统之前,先将焦点放在CPU和AI加速器上。
CPU的防守与AI的进攻
过去几年间,服务器CPU市场发生了一些变化。
英特尔的老对手AMD,凭借着台积电的先进制程,更多的PCIe和DDR,抢走了一些英特尔的市场份额。
英特尔还有新对手,以云服务巨头AWS为代表的公司自研的Arm CPU服务器,开始在服务器市场占据份额。
新上任的Justin将如何应对?
“至强6的性能具备领先性。我们对微架构做了一些优化,在一些特定应用里,能够看到它在性能方面的提升。但这些性能提升,在一些传统的跑分或基准测试当中,并不一定会呈现出来。”Justin还特别提到了至强6的能效核产品。
“能效核是一个新兴领域,目前主要针对两个部分,其一,有客户要打造一个以Arm架构为基础的生态系统,我们的能效核产品是满足该需求的非常好的另一种选择。其二,如果客户希望能够更好的优化产品,实现更高的每瓦性能,能效核处理器可以帮助他们实现目标。”
除了产品本身的优势,代工业务也将增强英特尔产品的竞争力。
“我们的芯片生产能力、生产效率过去几年逐年提高,兑现了四年五个制程节点的承诺,现在至强6能效核使用的是最新的Intel 3制程,接下来会过渡到Intel 18A,我们会努力在制程技术上不断保持领先性。”Justin指出了制程的重要性。
保持制程的领先性是应对AMD以及Arm阵营竞争的基础,但芯片的竞争最后是生态的比拼。
英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立对雷峰网(公众号:雷峰网)表示,“软件上我们具有很强的生态优势,尽管这并非人无我有,但英特尔以开放为生态的核心逻辑,让我们对开放生态的力量和x86未来的发展充满信心。”
非技术因素的角度看,“英特尔是唯一一个在过去数十年来,一直深耕于数据中心业务的公司,基于这一认知,客户对我们的信任日益加深,愿意将他们的业务托付给我们。”Justin同时表示。
如果说至强6是英特尔拿出的防御盾牌,那至强6+ Gaudi3就是英特尔进攻AI市场的组合拳。
Justin透露,按照现在的进展,Gaudi3 AI芯片可以如期在今年第三季度实现全球上市。基于业界领先的开源模型测试的性能数据,至强6和Gaudi3结合在一起,相比英伟达H100和H200,有2倍于推理性能优势,并且更加适用于越来越多企业采用的RAG(检索增强生成)技术。
但Justin也再次强调,“想要在AI市场取得成功,并非只看其中一、两个组件,而是要有系统观、全局观。我们和主要的客户开展系统建设和设计,包括超大型的云服务商, OXM(即OEM和ODM结合在一起),我们一起做系统设计,并验证和优化这些系统在主流、开源的模型上的表现和性能。”
此时就可以更进一步谈论开放生态的巨大威力。
英特尔的蜜糖,英伟达的砒霜
总会有人以为英特尔和开放生态相去甚远,实际上英特尔在开放社区的投入和活跃度一直很高。
就以AI来说,英特尔积极参与构建全球开源AI软件的标准,比如纵向扩展的工作负载(UALink,可以实现GPU和GPU之间的通信),横向扩展工作负载(UEC),以及针对系统设计和机架设计的OCP(开放计算项目)。
软件方面,英特尔打造了底层编程软件产品oneAPI,还有OpenVINO等。
开源软件的集成方面,英特尔也和PyTorch、OpenAI的Triton一起合作,打造开源模型。
今年4月份英特尔推出了企业AI开放平台——OPEA。
“有一个开放的生态系统,它能让所有人都参与创新和市场的发展。”Justin说,“我们也看到,其实最好的创新,往往来自于标准以及开放的生态系统。”
科技行业的发展史一次次证明,开放的生态最有生命力。
x86 CPU的成功就得益于开放,在x86 CPU成功之前,PC的市场属于IBM,IBM提供一整套PC系统,赚走几乎所有利润。
x86 CPU的诞生以及开放的标准,让更多参与者能够进入这个市场。
此后在x86 CPU的基础上,有了新的PC产品、云产品、新的服务器、虚拟化等,迎来了PC、云计算的普及和繁荣。
如果AI按照这样的方式发展,开放的生态也更能催生AI创新。
“我们看到有一些客户把AI功能嵌入到现有的应用当中,而这些应用也是运行在X86平台之上。打造一个开放生态系统,就可以让我们的客户在现有的x86应用平台上轻易部署AI。”Justin说“未来,我们也将通过这种方式持续保持x86技术和x86平台在整个数据中心领域的竞争力。”
开放生态可以成为英特尔在AI市场最强大武器的同时,也可能成为超越英伟达的机会。
目前英伟达的数据中心GPU最小的售卖单位是8卡,如果想要获得最强大的AI性能,就需要购买售价高昂的DGX系统。
如今的英伟达与PC机时代的IBM有相似之处,x86的故事是否会在AI时代重演?