华为这家企业,你不服不行。
昨天晚上,从德国传来好消息,风传已久华为自家全新一代手机Soc处理器——麒麟(Kirin)970芯片正式发布。更重要的是,它同时还是第一款带有AI的手机芯片。
而搭载麒麟970的全新旗舰手机Mate10系列,将在今年10月16号在德国慕尼黑正式发布。
究竟麒麟970强在哪里?华为凭借麒麟970又能打开怎样一个手机新世界?且听雷锋网为你解释一番。
作为本次麒麟970的最大看点,NPU最受到大家关注。
NPU实际上是“Neural-network Processing Unit”的简写,翻译过来就是“神经网络处理器单元”。我们现在耳熟能详的各种人工智能能力,大部分都是依靠对人类大脑的部分模拟实现的,即神经网络运算。
寒武纪板卡
根据雷锋网了解,这颗NPU并非华为独立打造,技术方面主要由国内AI芯片创业公司寒武纪负责。后者去年已经发布了第一款深度学习专用处理器“寒武纪1A”,同时还为其配套了专用的指令集系统。就在两个星期之前,寒武纪还完成了A轮融资,总金额达到1亿美元,融资方包括国投创业、阿里巴巴、联想等一批知名巨头和VC。
所以NPU是专门为了人工智能而生,根据官方现场PPT,这颗NPU的性能将达到1.92T FP16(半精度浮点运算)。相比之下,经常拿来作为神经网络研究的NVIDIA GTX1080,FP32的处理能力为8.87T。由此换算,GTX1080的FP16能力大约为17.74T。
换句话说,NPU的性能约等于1/9个GTX1080。
因为专用,NPU在性能强大的同时,还拥有极佳的功耗表现。华为官方也给出了4个比例:NPU的性能6.25倍于CPU、4倍于GPU;NPU的效能50倍于CPU、6.25倍于GPU。
华为还给出了一个实际的应用场景表现,在用NPU识别1000张图片的过程中,NPU的整体功耗只在0.3-0.7W之间浮动,实际的电池消耗仅为0.19%(4000mAh电池)。换句话说:如果电量充足,NPU完全可以利用一块电池实现50W张照片的识别。
NPU在专用场景中的性能表现可见一斑,但专用处理器并不只是靠硬件就能运作,华为此次也同时发布了自己的开放AI平台,专门搭建具体应用到CPU、GPU、NPU等硬件处理器之间的“桥梁”,这也是NPU能够发挥性能的前提条件。
从发布会上的信息来看,这套AI平台主要有两层:第一层由Google自家的API Android NN(Neural Network,神经网络)、华为的Kirin AI API组成。第二层则是Kirin AI Heterogeneous Resource Management(麒麟混合资源管理)和其他Runtime方案组成。
从整体布局上来看,华为并不想单纯依靠于Google官方的工具,而是希望通过向开发者开放,进而彻底将华为的硬件能力释放出来。
华为在发布会上也稍微展示了一下这套架构的威力,在2000张图片识别的基准测试中,麒麟970取得了2005的分数,相比之下依靠CPU的三星S8只有95分,而在GPU调用方面比较出色的iphone也只不过487分。
在发布会之上,华为也宣布了相对应的AI生态举措。主要包括开发网站、麒麟AI开发套件、应用市场三块。利用华为全线资源扶持这个生态的趋势,显而易见。
说完NPU,我们再回头来整体看看麒麟970,先放一张规格:
制程:TSMC(台积电)10nm;
CPU:4个A73 2.4GHz + 4个A53 1.8GHz;
GPU:Mali G72MP12(12核);
NPU(新增AI处理器):1.92T FP16 OPS;
Image DSP(图像专用处理器):512bit SIMD;
Modem(基带):1.2Gbps@LTE Cat18;
内存:LPDDR 4X;
存储:UFS 2.1
....
我们先从制程看起,麒麟970选择了全新的TSMC 10nm工艺。在这一点上,970看齐去年年底的骁龙835,后者选择了三星的10纳米工艺。
因为新制程的关系,麒麟970相比上一代960将会有20%的功耗降低,同时在封装尺寸上还将缩小40%。但实际上,970再次刷新了麒麟系列芯片中晶体管数量的记录——55亿个晶体管,远超上一代麒麟960的40亿个。相比之下,骁龙835只有30亿,苹果iphone7系列使用的A10处理器也不过33亿个。
但实际上,这次970的CPU部分是“不思进取”的。8个核心的组成方式(4个A73+4个A53)、8个核心对应的运行频率,实际上与麒麟960完全一致。
真正的改变主要集中在GPU和NPU上。GPU采用了全新的Mali G72MP12。这也是手机首次用上12核GPU。而就其组成Mali G72图形处理器单元来说,相对于上一代麒麟960的G71图形处理器单元来说,并没有大幅度的性能提升。所以按此估算,麒麟970的图形处理性能大约会接近960的1.5倍。
在拍照方面,麒麟970采用了两个ISP,在拍照这一应用场景中取得了很大进展:更快的反应速度、更快的对焦速度、运动拍摄帧率更大、暗光场景下的拍摄能力更强。
最后是网络,华为在麒麟970之上,再次扩宽了4G基带频率范围,同时还支持最先进的4.5G LTE技术。在极限条件下,整体带宽最高能达到1.2Gbps。
看到这里,或许还有很多人并不理解:麒麟970是更强了,但为什么说它正在打开手机新时代的大门?
这一点我们要倒回手机这个应用场景本身去看,在去年的WWDC16之上,苹果就为iOS 10中的“照片”提供了一个功能:照片应用会自动根据地点、主题等将照片归纳分组,除此之外,它也能将内部的一些相关资源组合,生成一些“回忆合集”。这种东西在原来都是不可想象的。
很明显,如何利用人工智能释放出更多功能、更多能力,已经成为手机发展的下一个战场。
就拿去年红极一时的Prisma来说,这款能够将各种照片变成“名画风格”的应用一开始它选择的是将照片上传到服务器处理,但随着用户的数量不断增加,处理速度也变得越来越慢。直到去年年底Prisma开始在iPhone上面开始调用本地GPU来处理,往往能够在2s内完成处理,同时还不受网络好坏的影响。这样的新体验是“革命性”的。
正如余承东在发布会上列举的那样,我们不远的将来或许能够实时使用计算机视觉分析街道、能够在低功耗的前提下使用AR、翻译之类的应用也将变得更加准确。
对于为手机端添加AI能力的持续影响,华为其实也做了思考。除了上面提到的这种革命性改变之外,隐私问题同样重要。之前我们经常将数据上传到云端去处理。上传到云端的数据是否会泄露?是否会被违法使用?完全依赖云端或者本地的数据其实都不可行。
完美的解决方案应该是把隐私的数据本地处理,不隐私的数据云端处理,进而兼顾隐私和能力,让用户能够最大程度获得人工智能带来的改变。
功耗同样重要,在体积有限、电池技术短期无大突破的前提下,造“电老虎”并没有实际意义,因为专业软件底层、调用、硬件的配合,手机对于处理人工智能需求也会变得高效。进而确保了手机能够持续输出革命性的体验。
将这些趋势组合起来,其实可以很容易得到解决方案,但这件事之前实际上几乎只有苹果在做。
一方面是因为苹果自己采用了相对封闭的生态,在技术实现上相对适应性强一些。第二个是全新技术加入,同样需要大量资金和人力的投入,“富可敌国”的苹果自然不缺那些。最后是借助外力,只有整个生态完善了,才可能持续不断地为消费者创造新体验。
这件事,按照对位来说,本来应该由Google完成,但Google本身的纯软件定位和现有的手机硬件市场,注定依赖Google并不靠谱。自己做,几乎是唯一靠谱,但又需要大量勇气的方法。
就已经在手机核心模块中初步打造出AI能力的华为来说,已经迈出了最重要的前几步,如何在此基础上继续培育生态、开发更多全新的手机功能,为消费者带来全新体验,这依旧是个很大的挑战。
挑战归挑战,还是得给华为的勇气和远见点个赞。