雷锋网消息,在昨晚的IFA大会上,华为消费者业务CEO余承东面向全球推出了全新处理器麒麟980。
海思半导体一直是华为的关键战略组成部分,它使华为将自己与其他依赖高通等SoC供应商的公司区分开来。当然这种策略是一把双刃剑,“梭哈”麒麟SoC意味着芯片的设计必须正确,否则会让华为手机反陷于不利的竞争地位。
此前的麒麟950是一款令人印象深刻的芯片,它应用了当时最先进的台积电16nm FF+工艺和Cortex A72架构,这一强强联合赋予了麒麟950强大的竞争力,为华为带来了丰厚的回报。
而后来的麒麟960和麒麟970则展示了这一策略的风险一面。麒麟960是一款使用16nm FFC工艺(比16nm FF+工艺差一些)制造的SoC,被同期使用10nm LPE制程的高通骁龙835和三星Exynos 8895占据了主导地位;麒麟970虽然换用了台积电10nm工艺,但却只使用了Cortex A73架构,而骁龙845则为从Cortex A75优化而来的Kryo 385架构。此外这两代麒麟处理器的GPU能效也受制于孱弱的Arm Mali G71/G72架构而缺乏竞争力。
此次在设计麒麟980时,华为又再次处于一个非常有利的位置上,Arm全新的Cortex A76和Mali G76架构在能效方面均有很大飞跃,而台积电也在全力推进其7nm制造工艺。
正如昨天发布会上所见,麒麟980使用了Cortex A76+Cortex A55的DynamIQ CPU集群以及Mali G76 GPU集群。
在以往的设计中,一个集群中的几个核心都运行在相同的时钟和电压上,如果有一个高性能线程需要高性能状态,其他线程也要跟着提升频率,能效比被迫被拉低。而此次海思半导体充分利用了Arm的新DSU集群及异步CPU配置,将麒麟980中Cortex A76架构的高性能CPU集群细分为两组,各自运行在不同的频率和电压上,可有效提升实际使用时的能效比。
两组Cortex A76 CPU中,高频率的一组运行在2.6GHz频率上,比Arm此前公布的3GHz目标要低不少,但高于此前预测的2.5GHz保守频率。尽管如此,全新的CPU架构仍然带来了显着的性能改进,Cortex A76在2.6GHz频率下的表现仍然非常出色。另一组Cortex A76 CPU的运行频率为1.92GHz,这应该是一个很好的能效比平衡点,两组核心可根据不同使用场景灵活调用。
缓存方面,所有Cortex A76都带有推荐的512KB L2缓存配置,而A55则采用128KB缓存。在雷锋网此前分析Cortex A76的文章中曾提到过,在最新的DynamIQ群集配置中,L2缓存是每个CPU核心独占的。DSU中的L3缓存则为4MB共享式设计,容量为骁龙845的两倍。
华为表示麒麟980相比麒麟970可获得75%的性能提升,能耗比则比麒麟970提高58%。华为演讲中的PPT脚注显示其能效数据基于Dhrystone,而Dhrystone非常专注于考验CPU核心,相对在内存等其他方面不会给SoC带来太大的压力。
麒麟980使用的Big.middle.little三层结构也带来了调度方面的复杂性,海思半导体表示其采用了一种新的“灵活调度”机制,但遗憾的是目前尚无更多细节。在真正拿到第一台麒麟980设备之前,关于性能和功耗的数据仅限于数据估算。
经过一些简单计算后,麒麟980的性能和功耗表现基本与此前Arm发布Cortex A76架构时推测的情况相差无几。2.6GHz的Cortex A76性能达到或超过2.7GHz的三星Exynos 9810并无问题,相比骁龙845则可领先30%左右。而7nm工艺下,麒麟980的2.6GHz的Cortex A76核心功耗甚至低于1.8GHz的三星Exynos 9810,能耗比冠绝全场。
麒麟980也是第一款采用Arm全新Mali G76 GPU的SoC。雷锋网在此前分析Mali G76时曾提到,Mali G76与以往的Bifrost架构有很大的不同,它极大地改变了核心的内部结构。
Mali G76为了提高架构的性能和面积效率,将GPU内的基础计算模块的规模增加了一倍,单个EU内拥有8组FMA和ADD/SF流水线。实际上,一个Mali G76核心的运算资源相当于两个Mali G72核心。
在纸面上,麒麟980的Mali G76 MP10可能乍一看比麒麟970中的Mali G72 MP12要小,但实际上它相当于Mali G72 MP20,也就是运算资源扩充了66%,这还不包括新架构的运算效率改进。
麒麟970的GPU频率高达747MHz,但此频率下的能耗比表现不佳,导致在实际使用中往往由于功耗和发热较大而不得不降低运行频率。据海思半导体透露,麒麟980的GPU频率为720MHz,性能相比麒麟970提升46%,能耗比则大幅提升178%。
若以行业中常用的GFXBench曼哈顿测试为基准,经过一些简单计算后可得出以下数据:
虽然根据Mali G76规模的不同,以及不同的测试对像素填充率和算术逻辑运算的负载不同,所得出的测试结果也不尽相同,但不得不说,至少在GFXBench曼哈顿测试这个基准下,麒麟980的绝对性能相较于骁龙845的Adreno 630来说仍然有所不及。
不过,麒麟980的GPU能耗比确实有了相当的飞跃,华为给出的178%也与在之前分析Mali G76时的推测基本相符。如果在实际设备上也是这样的水平,则意味着麒麟980跳脱了此前Mali G71/G72的大坑,可持续功耗水平恢复到了麒麟950的良性水平。
麒麟980使用了LPDDR4X内存控制器,并声称在业内第一个支持了2133MHz内存,带宽增加13%。麒麟970的缺点之一是内存控制器在较高频率下非常耗电,希望麒麟980可以解决这一问题,在高频率下保持较高的效能。
华为在发布会上公布了一些内存延迟和带宽数据:在GeekBench 4测试中,麒麟980的延迟为138ns,骁龙845则为176ns。不过这些数据的参考性有待确认,因为麒麟970和骁龙835的延迟也在138ns左右,并且三星Exynos 9810的表现比它们都要好,其延迟只有78ns。
麒麟980使用了全新的ISP,图像处理吞吐量提升46%,能够支持更高分辨率的摄像头数据。新ISP的改进之一是引入用于HDR的10bit图像处理流水线,这是今年SoC中普遍增加的特性,但由于实际手机产品在色彩管理和屏幕两方面跟进不足,这一能力实际上很少使用。
新ISP的另一改进是支持“多通道降噪”技术,这听起来很像今年骁龙845中引入的多帧降噪功能,其降噪基于时间帧而不是空间像素,降噪效果更好且没有模糊的副作用。此外新ISP还有一个新的视频编码管道,可降低33%的视频捕获延迟。
不过,麒麟980的视频编码能力仍然维持在4K@30fps水平上,这对于一款全新SoC来说是一个竞争劣势。
麒麟980继续改进其神经网络推理加速架构,并推出全新双核NPU。新的双核NPU仍然每次只处理一个模型内核,这意味着单个模型推理的速度可以被加倍。华为表示,麒麟980的全新双核NPU比麒麟970的NPU快2.2倍,每分钟可实现4500次推断。
麒麟980中的全新Cat.21 4G基带支持4x4 MIMO、1.4Gbps下载速率和2x2 MIMO、200Mbps的上传速度,同时支持5CA、256QAM、3x载波聚合,堪称5G到来之前的最强基带。
除了4G基带之外,华为还谈到了可与麒麟980配套使用的Balong 5000 5G基带,这种搭配就如同下一代高通骁龙SoC将配套X50基带一样。不过华为没有透露关于二者配套的细节,只是称我们将在明年某个时候看到使用麒麟980+ Balong 5000的设备。
在以往的SoC中,华为通常会使用博通的WiFi模块。博通一直被认为是行业领先的,市场上的大部分旗舰设备中用的都是博通的WiFi解决方案。
不过此次麒麟980出人意料的使用了全新Hi1103 WiFi模块,支持802.11ac标准、2x2 MIMO和160MHz频宽,速度高达1732Mbps。同时Hi1103还支持L1+L5双频GPS定位,L5频段下定位精度可提升10倍。
之前的麒麟960和麒麟970由于工艺和架构的劣势,在市场竞争中受到很大影响。这次的麒麟980希望能够解决这些问题,在各方面都有重大改进,使用了台积电最新的7nm工艺、Arm最新的CPU架构Cortex A76和GPU架构Mali G76,再加上内存控制器、ISP、NPU等模块的改进,使麒麟980看起来确实是一款非常均衡的SoC,在市场上处于极佳的竞争地位。首部搭载麒麟980处理器的智能手机Mate 20将于10月16日推出,应该是一款值得期待的设备。
via:Anandtech
相关文章:
Cortex A76没出生就已被它干掉——三星Exynos M3架构详解
浅析Arm全新Mali G76 GPU:全方位进化,但仍不足与高通苹果匹敌