12月6日,高通在美国发布最新一代旗舰移动平台骁龙855,一周后的12月13日,联发科技在深圳发布了最新处理器Helio P90。加上此前亮相的三星Exynos 9820、苹果A12 Bionic以及华为海思麒麟980,可以说手机SoC已经进入了比拼AI性能的时代。不过,苹果和海思集成了专为AI加速的硬件单元NPU,但高通和联发科却选择了优化的路线,这是为什么?
7nm不是唯一选择
苹果的A11 Bionic和华为海思麒麟970在去年发布的时候就已经集成了专为AI加速的NPU单元,但AI性能的提升离不开工艺制程、CPU、GPU等硬件以及软件的共同协作。我们知道,在很长一段时间内处理器性能的提升靠的是工艺制程的提升,到了AI时代,除了在设计上需要做进一步的优化,对先进制程的需求也更加强烈。因此为了继续提升处理器的AI性能,麒麟980和A12 Bionic都选择了台积电的7nm工艺,都集成了69亿个晶体管。同样选择台积电7nm工艺的还有本月发布的骁龙855,但这款SoC集成多少个晶体管暂不清楚。
不过,7nm并非最新手机SoC的唯一选择,联发科Helio P90采用的是12nm制程,对于为何不采用7nm工艺的问题,联发科技无线通信事业部总经理李宗霖接受媒体采访时表示:“并不是有7nm就可以有很好的AI体验,还需要考虑系统架构、功耗以及与应用的结合。同时,还与我们要带给消费者什么样的体验有很大的关系。”雷锋网认为,Helio P90的定位并非旗舰级,因此必须更多的权衡7nm成本增加和性能提升之间的关系,显然12nm是联发科认为性价比最高的工艺。
三星Exynos9820虽然定位是旗舰级,但却采用了8nm工艺。原因很简单,8nm LPP工艺是三星基于10nm LPP演进而来的工艺,可以使芯片能效提升10%,芯片面积降低10%。
可以看到,虽然不是5款最新处理器并非全都采用7nm工艺,但可以明确的是在处理器性能的提升上,手机SoC设计厂商依旧期待制程提升带来的性能、功耗、芯片面积的提升,即便半导体制程的提升正变得越来越难。
CPU高性能核心集群再细分
选择了工艺节点之后,在设计不出大问题的情况下已经在很大程度上决定了这款处理器的性能。当然,为了满足AI的需求,上述5款处理器有3款处理器的CPU采用了大中小核的架构。麒麟980是率先采用了Big.middle.little新设计的SoC,也就是将高性能核心集群再细分为高、中两部分,包括2个Cortex A76@2.6GHz、2个Cortex A76@1.92GHz、4个Cortex A55@1.8GHz,三个集群将根据不同使用场景灵活调用,提升能耗比。
三星同样采用Big.middle.little新设计,不同的是由于三星有自主研发的Mongoose架构CPU,因此Exynos9820的CPU是2个第四代Mongoose架构内核、2个Cortex-A75、4个Cortex-A55组合在一起,自研内核和Cortex-A75提供高处理性能,Cortex-A55提供更高效率。三星称,对比上代旗舰处理器Exynos9810,智能任务调度程序的新设计可将Exynos9820的多核性能提升15%。
骁龙855采用基于Arm Cortex A76 打造的 Kryo 485 CPU,首次集成了一颗超级内核,主频高达2.84GHz,3颗主频2.42GHz的性能内核,4颗主频1.80GHz的效率内核。高通表示骁龙855芯片相比前代产品骁龙845,CPU性能提升 45%,是8系列处理器有始以来最大的一次提升。
苹果和联发科则没有采用大中小核的设计。苹果A12 Bionic的CPU采用6核设计,2个性能核心承担高强度的计算任务,4个能效核心处理日常任务。苹果称最新的性能控制器可动态分配工作至不同核心,需要高速运行时可同时发挥全部六个核心的性能。相比A11 Bionic,A12 Bionic的2个大核速度提升最高达15%,4小核最高节能50%。
联发科Helio P90也采用八核架构,包括2个Arm Corte A75处理器,工作主频率为2.2 GHz,与6个A55处理器,工作主频率为2.0 GHz。联发科表示,最新的CorePilot技术可以确保芯片能够以最高效的方式在八核之间实现运算资源的最优配置,充分发挥八核架构优势。至于为何没有采用大中小核的设计,联发科技资深副总经理暨技术长周渔君对雷锋网表示 :“我们希望每种核心之间的表现能有明显的差别,不然大中小核的架构可能意义不大。当然,架构的选择还需要关注SoC的制程、散热、用途等方面。”
GPU性能提升最高达50%
除了CPU,GPU也是移动SoC主要的关注点,A12 Bionic 4核GPU相比上代3核心的A11 Bionic GPU速度提升最高为50%。麒麟980首发Arm最新的GPU架构Mali G76 MP10,与麒麟970的Mali G72 MP12相比,性能提高46%,能效比提高178%。Exynos的GPU同样从Mali-G72升级为Mali-G76,三星称升级后GPU的性能提升40%或35%的功耗表现。
骁龙855集成Adreno 640 GPU,高通表示新GPU能够带来20%的图形渲染速度提升,同时还能继续保持业界领先水平的每瓦特能效。Helio P90没有选择Arm Mali GPU而是集成了Imagination的PowerVR GM 9446,联发科表示对比Helio P70,Helio P90的GPU性能提升了50%。
骁龙855和Helio P90为什么没有NPU?
了解完5款最新手机SoC的工艺制程、CPU和GPU的升级之后,接下来要谈的是这些最新SoC都强调的AI性能。苹果和华为在SoC中集成了专为处理AI设计的新的NPU,其中A12 Bionic的Neural Engine架构从A11 Bionic的双核增加到了八核,性能也从A11 Bionic每秒能完成6000亿次操作提高到A12 Bionic每秒能够完成5万亿次运算,并且Core ML运行速度最高可提升至9倍。
麒麟980的NPU则是从单核升级为双核,使用了更高精度的深度网络,每分钟可识别4500张图像,具备更高的实时性,支持人脸识别、物体识别、物体检测等AI场景。余承东表示,新的 NPU 处理单元速度比麒麟 970 的NPU快 2.2 倍。
相比苹果和华为海思集成NPU已经到了第二代产品,Exynos9820则是三星首次在SoC中集成专门处理人工智能任务的硬件单元NPU。三星方面称,在NPU的支持下,Exynos9820相比Exynos99810人工智能性能提升7倍,并可以增强从照片到AR的性能。
高通和联发科则没有集成专门处理人工智能任务的硬件单元,而是在已有的硬件单元上进行优化和改进。骁龙855选择在DSP中集成一个全新设计的Hexagon张量加速器(Hexagon Tensor Accelerator,HTA),另外,Hexagon 690处理器、Adreno 640 GPU、Kryo 485 CPU共同构组成了骁龙855支持的第四代多核人工智能引擎 AI Engine,可实现每秒超过7万亿次运算(7TOPs),AI性能较骁龙845提升3倍。
Helio P90对AI性能的提升则是借助APU1.0到APU 2.0的升级,使AI算力提升4倍。据悉APU 2.0采用联发科技的融合AI(Fusion AI)架构,AI算力最高可达到1127 GMACs(2.25 TOPs),支持Int8和FP16。雷锋网此前报道过,APU是基于此前 Helio P30 内置的 VPU(图像处理单元)经过算法提升而推出。因此APU也是基于此前的硬件单元进行的升级和优化。
那么,高通和联发科为什么不像苹果、华为和三星一样在SoCial中集成专为AI加速设计的硬件单元?其实原因很简单,那就是AI相关的技术和算法都还不够成熟,高通和联发科作为手机SoC的提供方,在确定到底哪种算法以及数据类型最适合深度学习之前,押注其中一种不仅不是明智的选择,还可能因为硬件跟不上算法迭代而无法满足市场的需求缺乏竞争力,因此除了借助工艺制程、CPU、GPU的持续升级满足AI应用,高通和联发科还针对目前比较热门的AI图像应用在已有的硬件上进行优化来更好地适应不同手机厂商的需求。还有一点也非常关键,增加NPU带来的成本的增加手机厂商可能难以接受。
相反,无论是苹果、华为还是三星,他们自主研发的SoC目前都只用于自家的手机中,因此在应用和需求相对明确的前提下去增加专用的AI加速单元不仅能获得更好的效果,还能借此打造更多吸引消费者的AI应用,增加手机的吸引力和竞争力。当然,作为全球手机销量前三的三星、华为和苹果,手机的销量也是支撑他们研发自主芯片和集成NPU的基础。
雷锋网小结
手机作为最普及的智能设备,对于AI的发展和普及有非常重要的作用,手机SoC除了比拼CPU和GPU性能,现在也开始比拼AI性能。不过在AI发展的初期,技术还有很多不确定的时候,手机SoC的提供方选择的是在已有的硬件上进行优化满足AI应用需求,而具备自主研发处理器能力的手机厂商在需求和出货量都更明朗的情况下用NPU来增加手机的竞争力。
还有不可忽略的是,软件在AI性能的提升中发挥着非常重要的作用,越来越多的芯片厂商都在增加在软件方面的投入和优化,同时还在增强与软件公司的合作。
到底谁的AI性能更高体验更好?光看跑分和性能的提升我们难以简单下结论,我们需要等待搭载骁龙855和Helio P90的手机发布后,再做一个对比。
相关文章: