上周,在鲁大师新公布的2020年1-3月手机AI芯片排行榜上,高通最新旗舰移动平台骁龙865以112309分的成绩登顶,是排名第二的苹果A13处理器59050分的近两倍。苹果的A系列处理器诞生之初表现平平,经过多年迭代,最新的A13处理器十分强大,特别是AI性能。
这一次,骁龙865的AI跑分性能远超苹果A13,不仅证明了骁龙865搭载的高通第五代AI Engine强大的实力,也让我们对更多AI应用的落地充满期待。
鲁大师2020第一季度手机AI芯片排行
骁龙865 AI跑分强势登顶
2019年的手机和手机SoC发布会上,AI跑分似乎已经和CPU、GPU跑分一样重要。国内著名的跑分软件鲁大师也推出了AImark,并于2019年将AImark升级为2.0。
鲁大师AImark使用四种神经网络ResNet34、InceptionV3、MobileNet SSD、DeepLabv3+模型,对应图像分类、图像识别、图像分割测试,通过手机SoC的识别效率判断手机的AI性能。
不过,要获得高跑分不仅完成测试的速度要快,还要准确率够高。
鲁大师AImark评分标准
骁龙865在鲁大师第一季AI跑分中以近乎第二名两倍的跑分强势登顶,说明了骁龙865在鲁大师AIMark的评分体系下,准确率、性能、能效都是最优。这就值得我们进一步深挖高通实现强劲AI性能的关键。
高通第五代AI Engine如何炼成?
骁龙865的性能提升和功耗降低,图片来自vivo官网
骁龙865是高通2019年底发布的最新一代旗舰移动处理平台,集成的新一代Kryo 585 CPU较上一代性能提升达25%,全新的Adreno 650 GPU整体性能也较前代平台提升25%。特别值得关注的是,骁龙865搭载的高通第五代AI Engine,性能最高可达每秒15万亿次运算(15 TOPS),是上一代骁龙855 AI性能的2倍,相比骁龙845 AI性能更是提高了5倍。
高通第五代AI Engine
手机处理器15 TOPS的性能在业界是什么水平?根据公开数据,业界去年底到今年初发布的最新5G手机SoC的AI性能在4.5TOPS到10TOPS之间。明确了骁龙865第五代AI Engine的15 TOPS AI性能在业界的地位之后,接下来的问题就是第五代AI Engine是如何在移动端实现这么高的AI性能?
对于依靠有限的电池供电的移动设备而言,找到性能和功耗的最佳平衡点才是最大的挑战。单纯从芯片设计的角度,要实现高性能低功耗专用电路是个好选择,但专用电路灵活性非常低,难以满足不断迭代和更新的AI算法需求。
因此,高通自第一代AI Engine就采用了异构设计的思路,用一系列的硬件和软件组成AI Engine,包括Kryo CPU、Adreno GPU、Hexagon处理器,更好地实现精度和功耗的最佳平衡。比如在适合标量处理器上运行的任务就调用Kryo CPU,深度神经网络的全连接层放在Adreno GPU上处理,而池化层、卷积层等就用Hexagon张量处理器处理。
在第五代AI Engine中,除了CPU和GPU性能提升带来的AI性能的提升,高通还改善了GPU的浮点运算性能,全新的张量加速器首次引入HTA实现了专用的可编程的AI加速,将TOPS性能提升了4倍。
这样的设计,让AI Engine可以用Adreno GPU加速16位和32位浮点运算,用Hexagon处理器负责加速8位和16位定点运算,保证灵活性的同时实现更好的效能。
而高能效的实现,Hexagon处理器成为关键。这是因为,业界刚开始应用AI技术的时候,为了解决问题,会用更复杂的网络和更高精度的数据(比如32位浮点数)训练网络,但这需要消耗大量计算资源和能耗。随着AI算法的迭代和研究的深入,业界用稀疏化、剪枝、量化、压缩等多种方法优化神经网络,让边缘和终端设备进行AI推理的时候,能够用更低精度的数据,而不损失网络精度。
这对于追求高能效的智能手机意义重大,谷歌的一份白皮书曾指出,利用8位定点运算有助于模型更快的运行,同时它的能耗也更低。在AI领域耕耘多年的高通显然也了解这一点,因此,骁龙865 AI Engine的核心Hexagon 698 DSP张量加速器,选择支持的是支持8位和16位的定点运算,达到了能效比35%的提升。
另外,为了解决AI计算数据搬运能耗是卷积计算能耗几十倍甚至上百倍的业界难题。高通还开发了专用的深度学习带宽压缩,这项技术能够对数据进行高达50%的无损压缩,在不损失精度的前提下,让芯片需要处理的数据减少一半,实现更低功耗。当然,如果是对AI性能要求极高的应用,骁龙865支持的LPDDR5内存可以带来30%的带宽提升实现很好地支持。
可以看到,第五代AI Engine异构设计带来的灵活性,Hexagon处理器对定点8位和16位数据类型的支持有助于提升效能,还有专有的深度学习带宽压缩技术,让第五代AI Engine能够支持高精度的同时保持高能效。
不过还有一个关键——软件。复杂的异构硬件架构以及AI算法快速迭代对软件提出了更高的要求,只有让AI硬件和软件更好地融合,才能实现最佳的AI能效比。因此我们也看到,在AI Engine的硬件之上,高通有与之匹配的软件,每一个软件栈层都提供出色的特性和开放的访问权限,并且在持续升级。
第五代AI Engine的神经处理SDK、Hexagon NN Direct和高通AI Model Enhancer工具也进行了升级,支持开发者以极高的自由度和灵活性打造更快响应、更智能的应用。
不过,要衡量软硬件设是否真的够好,AI跑分到底有多大的参考价值,实际的AI功能和体验才是更好的评判标准。
强劲AI性能带来哪些AI功能?
骁龙865发布至今,已经有十多款搭载骁龙865的手机发布,已经成为2020年安卓旗舰机型的标配。这些手机上的AI功能和体验,正是骁龙865强大AI性能最好地展现。正如摄像头升级是当下智能手机的重点,拍照也是智能手机中AI使用频率最高的功能之一,包括AI美颜、超级夜景等,比如在小米10中,基于骁龙865的第五代AI Engine,小米推出了AI Pixel全局图像动态增强功能,通过智能调节,让画面更加鲜活生动。
小米10 AI Pixel全局图像动态增强,图片来自小米官网
又如iQOO 3 5G,结合骁龙865强大的AI性能和vivo拍照 AI 识别算法,在不同焦段,都能让拍摄大片变得更简单。还有,结合vivo特别定制的等效全画幅50mm专业人像镜头,通过AI人眼追焦,更容易拍出单反级人像大片。
iQOO 3 AI人眼追踪,图片来自vivo官网
同样搭载骁龙865的三星Galaxy S20有AI一键多拍的功能,一次拍摄,就可以获得不同镜头、不同滤镜的多种效果照片,无需重新拍摄就能选择最喜欢的效果。
OPPO Find X2也利用了骁龙865的AI性能,用3200万像素超高清前置镜头配合 AI 美颜,能拍出更自然和真实质感的自拍大片。另外,OPPO还推出了AI 自适应护眼系统,这个功能更好地让屏幕色温与环境融为一体。
在手机AI功能探索上,小米还有更多成果。比如,小米10可以利用骁龙865的Spectra 480 ISP和AI Engine实现AI 8K超清电影相机,并且可以在拍摄时实时将语音转录为字幕。还有,只要用户朗读20多句文本,系统就可以自主学习对应的人声,实现语音助手声音的定制。
当然,基于强大的AI功能,手机厂商可以在游戏中也利用AI Engine,配合Adreno GPU和骁龙Elite Gaming,加上5G和Wi-Fi 6的高速连接性能,通过软硬件联合优化实现不掉线、不卡顿、低时延、更高画质、更省电的游戏体验。
高通骁龙Elite Gaming
高通也与软件开发商密切合作,发挥AI Engine的价值。例如在AI实时翻译方面,有道和高通合作利用Hexagon处理器的强大AI性能,结合骁龙865的传感器中枢(Sensing Hub)来消除噪声和回声,在手机上就能实现实时翻译,让跨语言交流更加简单自如。这个功能的实现,没有最新的Hexagon处理器是无法实现的。
最后不要忽略的是,骁龙865不仅AI性能强大,还有顶尖的5G性能。这将带来更好更有价值的应用,就以手机端的实时翻译为例,未来在5G技术的支持下,实时翻译将会以更具沉浸感的方式呈现在人们的生活中。雷锋网
那么,你对5G+AI的未来还有哪些想象?雷锋网雷锋网
相关文章: