无论是靠摩尔定律的演进还是靠架构创新,计算性能的提升难度越来越大,不过Arm在最新的产品中还是带来了可观的性能和能效提升。
雷峰网(公众号:雷峰网)消息,今天Arm发布了2023全面计算解决方案(TSC23),基于全新第五代GPU架构的Arm Immortalis-G720 GPU相比上一代新能和能效分别提高了15%,系统级效率提升幅度达到40%。
全新的高性能CPU Arm Cortex-X4,相比上一代Cortex-X3,性能提升15%,基于相同工艺功耗降低40%。
当然,Arm更看重的是整体方案的提升。
Arm第五代GPU架构
去年,Arm首次推出Arm Immortalis GPU G715,是Arm首款移动端支持硬件光线追踪(Ray Tracing)的GPU。
今年,Arm最新的GPU产品采用了全新的第五代 GPU 架构,这是Arm迄今为止最高效的 GPU 架构。
据悉,Arm第五代GPU架构重新定义了部分图形管道,以优化内存带宽,能够在移动设备上支持高几何负载的下一代游戏和实时 3D 应用,目标是用更顺畅的移动端游戏体验,并媲美 PC 端和游戏主机。
其中,延迟顶点着色(Deferred Vertex Shading, DVS)是第五代 GPU 架构新引入的图形功能,这个功能的引入可以重新定义数据流,有助于合作伙伴扩展核心数量,达到更高的性能水平。
目前,DVS 的特性和优势已经在包括《原神》和《堡垒之夜》等许多流行游戏中得到体现。
以具体的产品看,此次新推出的GPU性能和能效最好的产品是Arm Immortalis-G720,与前代产品相比,Immortalis-G720性能和能效分别提高了15%,系统级效率更跃升了40%。
与G720同时推出的还有Arm Mali-G720 和 Mali-G620,是去年Mali-G715和Mali-G615的升级产品。
Arm 高级副总裁兼终端事业部总经理Chris Bergey表示,“第五代GPU架构为基于Arm GPU的未来几代视觉计算奠定坚实基础。”
CPU集群性能连续3年两位数性能增长
引入光线追踪是移动端GPU的新亮点,而移动端CPU的提升则可以带来更好的AI体验。
在Armv9架构推出之后,Arm实现了连续三年实现两位数性能增强的同时,效率也得到显著提升。
今年最新的第四代超大核Arm Cortex-X4,与Cortex-X3相比,性能提高15%。同时,基于相同工艺的全新高能效微架构可降低功耗达 40%。
Chris Bergey称,Cortex-X4性能和效率的提升可以将设备使用体验(如 UI 响应能力和应用程序启动时间)提升到一个新的水平,并让实现面向下一代人工智能和机器学习的应用成为可能。
性能和能效的提升显然离不开制程工艺的进步。据悉,在新一代 CPU设计中,Arm 在 TSMC N3E 制程工艺上顺利完成了业内首个 Cortex-X4 流片。
除了超大核,Arm也对大小性能核进行了更新,也就是Arm Cortex-A720 和 Cortex-A520。
Cortex-A720是被广泛应用的主力CPU IP,Cortex-A520强调高效率。
最新的Cortex-A720和Cortex-A520分别实现了20%和22%的能效提升,对于主流移动产品提升3A游戏、后台任务等体验能有显著的提升。
基于全新的CPU IP,Arm也提供性能核效率更优的CPU集群,DSU-120 是专为满足要求苛刻的多线程使用场景而设计,支持从可穿戴设备到智能手机、笔记本电脑的众多设备。
对于所有的处理器来说,安全也至关重要。
值得注意的是,今年发布的所有新 CPU 均支持 64 位计算和 Armv9 安全创新功能,能够抵御更高级别的数字威胁。
另外,通过 Armv9 CPU,Arm 在整个移动生态系统中持续成功部署 Arm内存标记扩展 (MTE) 功能,以消除占所有软件漏洞高达70%的内存安全漏洞。
如何与生成式AI结合?
“生成式人工智能等新的智能体验在过去的一年里令世界惊叹,而智能手机的人工智能处理能力每两年翻一番。”Chris Bergey表示。
Arm的全面计算解决方案想要在生成式AI中发挥作用,软件发挥着关键的价值。Arm会通过其开源软件库不断提升 Arm IP 的机器学习功能,让开发者在处理人工智能和机器学习工作负载时能充分获益。
另据了解,Arm NN 和 Arm Compute Library 已在安卓平台上面向 Google应用开放,目前已拥有超一亿的日活用户,助力开发者优化运行在 Armv9 CPU 和 Arm GPU 的机器学习工作负载。