日前,ARM在深圳召开了2015 ARM Tech Forum,会议上没有太多新东西。还是前一段发布的A72架构和CoreLink CCI-500,不过近来,ARM一直对Intel把持的服务器和数据中心市场很感兴趣。
ARM高级副总裁Pete Hutton乐观表示到2017年ARM将在服务器芯片市场占有5-10%的份额,Canaccord银行的分析师更乐观认为到2018年ARM将能赢得服务器芯片市场的20%的份额。
为何ARM如此有信心?在Intel把持的服务器市场,ARM会有机会吗?
一、A72架构和CoreLink CCI-500
长期以来,ARM走的都是低功耗,低性能路线,产品性能距离桌面的X86处理器很远,更不用说服务器芯片了。但是随着智能手机的不断升级,和PC市场的停滞,这个性能差距越来越小。
在A9之后,ARM意识到自己无法在性能和功耗之间兼顾,于是推出了大小核的策略,ARM称之为big.LITTLE,在低负载用小核心,高负载用大核心,平衡性能与功耗的矛盾。这样ARM就可以不太顾及功耗发展高性能核心。
第一款产品是A15,第二代是A57,如今的A72理论上是第三代产品。按照ARM的说法,Cortex-A72是其性能最出色、最先进的处理器,构建在Cortex-A57的基础之上,性能可达Cortex-A15 3.5倍。不过,从架构图和规格表上看,A72和A57并没有本质的不同,仍旧最多四核心,一级二级的缓存容量都没变,只是做了一些细节调整,比较明显的变化是砍去了NEON SIMD引擎中的加密扩展功能,总线接口扩展到128bit。
ARM自己则说是通过过对读写指令操作的不断优化以及细节上的创新提升了性能降低了功耗。
不过,我们要知道,按照ARM这种性能算法,A57比A15也有1.9倍的性能提升。那是建立在20nm对28nm工艺的基础之上的。同样,A72这个所谓3.5倍的性能提升,也是建立在16nmfinFET对28nm的工艺优势上。如下图:
实际上,ARM的A57在同频下相对于A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大约是1100分,1.7GHZ的A57跑specint2000是1250分。
按照ARM的比例,3.5倍的A72相比1.9倍的A57只提升了1.84倍,估计同频A72相对于A57大约也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000大约在1550分。
而根据前不久华为提供的内部测试的数据,同频同工艺下,A72相对于A57只有大约5%的性能提升。功耗也只下降了5%左右。
华为的数据或许没发挥出A72的潜力,但是A72相比A57在核心上的进步并不如ARM描述的那么大恐怕是事实。
核心上进步不太大,真正的进步是 CoreLink CCI-500,CoreLink CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,可以扩展到整个处理器的所有核心。
过去,ARM虽然支持多核心,但实际上是四个核心一个簇,簇内部是有侦听的,可以解决缓存一致性的问题,而簇之间是没有的,所以从四核心到八核心会有一定的性能下降。
而ARM提倡的大小核恰恰是八核心的,这次增加“探听过滤器”可以提升多核心的性能。而 CoreLink CCI-500最多支持的CPU簇从2个增加到4个,每个簇可以支持四个处理器,这样算最多可以支持16个处理器。
处理器增加,多核心效率提升,这就给进军高性能建设铺好了路。
在内存性能方面,ARM宣称CoreLink CCI-500可以提升30%的内存性能。再加上CoreLink CCI-500的内存贷款提升到了四通道128-bit内存位宽,这样数据的吞吐能力也有可观的提升,这对服务器来说至关重要。
所以,ARM的信心来源还是技术,在大小核战略之后,ARM的大核心性能已经有了长足进步,单个核心已经逼近Intel当年的酷睿2处理器,但是功耗却不大。性能功耗比不错。
另外一方面, CoreLink CCI-500提升了核心的支持数量,提升了多核心效率,还提升了内存性能与带宽,这都对服务器的性能是好事。
ARM的野心勃勃来自于技术的提升。
二、ARM有机会吗?
其实ARM进军服务器不是现在才开始提的,2011年Calxeda推出了搭载480个ARM处理器核心的低功耗服务器,惠普的微服务器也采用Calxeda的芯片,2013年百度采用MARVELL的ARM处理器搭建服务器。
但是这些尝试都失败了,因为当年的ARM处理器太弱,如今ARM凭技术进步想要卷土重来,它有机会吗?
单纯从性能看,ARM确实有了进步,现在用ARM指令集的芯片做服务器,在多核心支持上,内存带宽上都值得尝试。
但问题是,服务器不仅仅是个性能问题。多年以来,在硬件上、软件上、网络标准上,Intel已经深耕多年,IBM、HP这类巨头也已经在Intel的战车上捆绑了多年。
即使在IBM自己的PowerPC的小底盘,也是有成型的标准规范,ARM作为一个后来者加入,很难被接受。
你换用了ARM指令集的芯片,你的储存设备能否配套,原来的软件怎么办?原来的系统怎么办?原来的数据备份怎么处理?
这种转换的成本非常之高,几乎不可能迁移。
而Intel也不是固步自封,在智能手机市场,Intel虽然走错了路,但是追的很快。目前,Intel的智能手机芯片性能并不比ARM差。虽然在智能手机上因为安卓系统的原因发挥不出来,但是到了服务器市场,换上Intel熟悉的软件环境,就是ARM有力无处使了。
在服务器上,Intel同级别的芯片完胜ARM,用户完全可以用Intel的低功耗芯片方案来解决问题,成本会比换用ARM更低。
而且Intel还防御性的收购了Altera,真正要做低功耗低成本,ARM也不是对手。
在高性能领域,Intel有众核方面,其效率也不是ARM靠堆芯片所能比拟的。
所以,从硬件到软件,用户都没有换马的必要,尝试ARM不过是试水而已。
虽然ARM自己的技术进步了不少,但是在服务器市场机会依然渺茫。