资讯 芯片
此为临时链接,仅用于文章预览,将在时失效

天玑9300勇闯全大核CPU、端侧大模型时代

作者:包永刚
2023/11/07 12:26

又到了每年底手机旗舰SoC亮相的重要时刻,近几年风头正盛的联发科技拿出的最新旗舰产品说天玑9300,采用了独特的全大核CPU架构,让人有些意外,全大核架构实现了性能提升40%,功耗节省33%。

天玑9300勇闯全大核CPU、端侧大模型时代

全大核CPU架构之外,天玑9300的另一大亮点就是AI,在终端侧运行10亿、70亿、130亿、最高可达330亿参数的AI大语言模型。

GPU的升级性能相比上代有46%的提升,有第二代硬件光线追踪引擎。

天玑9300勇闯全大核CPU、端侧大模型时代

联发科技最新的台积电第三代4nm,集成227亿晶体管的天玑9300,首发将是vivo X100系列手机,OPPO Find X7系列手机也会率先搭载。 

勇闯CPU全大核时代 

从大小核的设计转变为全大核的设计是一个有趣的变化。

手机业界提出大小核的设计,是为了兼顾性能和功耗的平衡,让大核满足高性能的需求,小核高能效完成任务,此后还进一步演化出了分工更为明确的超大核+大核+小核的CPU架构。

天玑9300勇闯全大核CPU、端侧大模型时代

从这个角度来说,全大核是反其道而行之。

MediaTek资深副总经理暨无线通信事业部总经理徐敬全是这样解释全大核设计的原因,“现代APP设计复杂,运算需求超过以往,为了迎接现代和未来与日俱增的移动计算力需求,开创性设计了天玑9300的全大核CPU架构。”

这是从应用维度的解释,从技术维度联发科技也解释了这种做法的合理性。

联发科技无线通信事业部产品规划总监张耿豪表示,进入先进制程时代,漏电电流的增大无可避免,导致过去芯片上节能的小核在功耗表现上并没有比大核好多少。这个问题会在后续的发展中越来越严重,这也是促使联发科技在天玑9300上砍掉CPU上的“小核”,通过打造更强,更高效地完成任务的“全大核”处理器的重要原因。

天玑9300的CPU架构是1个3.25GHz的Cortex-X4 核心+ 3个2.85GHz的Cortex-X4核心 + 4个2.0GHz的Cortex-A720核心。

天玑9300勇闯全大核CPU、端侧大模型时代

天玑9300 CPU架构

与联发科技上一代天玑9200的一个3.05GHz的Cortex-X3核心 +3个2.85GHz的A715核心 +4个1.8GHz的A510核心相比,这种变化显而易见。

天玑9300勇闯全大核CPU、端侧大模型时代

天玑9200 CPU架构

“全大核架构虽然是一个革新,但也不是完全从零到有。因为另一家手机芯片大厂苹果之前就有相似的概念,其A系列芯片的小核虽然也叫‘小’,但事实上它并不小,而是比一些安卓芯片的的大核还要再大一点。”张耿豪进一步解释。

全大核的设计可以带来大幅性能提升,实验室实测数据,天玑9300在Geekbench 6中的CPU多核性能跑分在7500-8000分左右,超越了今年苹果发布的A17 Pro以及高通最近发布的第三代骁龙8。

天玑9300勇闯全大核CPU、端侧大模型时代

按照常规理解,性能高会带来非常大的功耗挑战,但联发科给出的数据给人惊喜,在日常使用场景中,天玑9300的功耗降低了最高30%,在日常浏览、短视频类应用中功耗也降低了10%左右。

天玑9300勇闯全大核CPU、端侧大模型时代

对于如何做到全大核高性能低功耗,徐敬全在发布会上的解释是迅速启动和休眠大核。

天玑9300勇闯全大核CPU、端侧大模型时代

这背后采用的是CPU处理器执行中的乱序执行(out-of-order),乱序执行就是CPU在执行指令的时候不按程序指定的顺序执行,能够带来的好处是减少阻塞,提升处理器的执行效率,但对外表现的行为还是和顺序执行的处理器一样,能效更高。

“这不是一个简单的事情。”张耿豪说,“这必须要把端到端、硬件到软件到系统都串在一起。其中很多很深度的事情底层甚至需要跟所有的生态链一起去完成。为此,联发科正在联手上游的合作伙伴谷歌,针对8大核的架构,在安卓AOSP上面调优。”

对于全大核的设计,很难仅仅凭借联发科技给出的评测数据就判断这是一个正确且有效的突破,我们需要等待搭载天玑9300的手机上市之后的表现再下结论。

并且即便走在正确的道路,也会面临很多困难,这是需要端到端的优化,对联发科技来说是更大的挑战。

vivo在天玑9300发布会上对全大核CPU架构的支持态度多少增加了一些对于这种架构革新的信心。

押注端侧生成式AI时代 

天玑9300勇闯全大核CPU、端侧大模型时代

天玑9300的众多升级中,与全大核CPU一样亮眼的是端侧大模型。为了满足大模型时代的需求,天玑9300搭载的联发科技第七代APU 790整数运算和浮点运算性能是上一代的2倍,功耗降低了45%。

天玑9300勇闯全大核CPU、端侧大模型时代

徐敬全介绍,APU 790是专门为生成式AI设计,其内置硬件级生成式AI引擎,边缘AI计算性能和安全性均有提升,还专门针对常用的Transformer模型进行了算子加速,处理速度是上一代的8倍,可以在1秒内完成常见的AI文生图功能。

同时,为了解决AI计算中的内存占用问题,联发科技研发了混合精度INT4量化技术,结合自研的内存硬件压缩技术NeuroPilot Compression,提升了内存带宽的利用效率,同时减少了AI大模型对终端内存的占用,让手机可以更顺畅地跑各类生成式AI应用,支持终端运行10亿、70亿、130亿、最高可达330亿参数的AI大语言模型。

另外,APU 790 还支持生成式AI模型端侧“技能扩充”技术NeuroPilot Fusion,可以基于基础大模型持续在端侧进行低秩自适应(LoRA,Low-Rank Adaptation)融合,让基础大模型更加全面的能力。

这些技术特性足以看出联发科技对于端侧生成式AI技术的重视,但AI的繁荣也需要丰富的额软件生态。

“MediaTek的AI开发平台NeuroPilot构建了丰富的AI生态,支持Android、Meta Llama 2、百度文心一言大模型、百川智能百川大模型等前沿主流AI大模型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验。”徐敬全表示。

天玑9300勇闯全大核CPU、端侧大模型时代

联发科技在天玑9300的发布会现场展示了与合作伙伴合作的众多AI应用,包括生成式AI图生GIF动图表情包,手机端运行Stable Diffusion文生图。

天玑9300勇闯全大核CPU、端侧大模型时代

雷峰网(公众号:雷峰网)了解到,联发科技展示的Stable Diffusion文生图的大小是512×512的分辨率,至于时间联发科技员工只是表示小于1秒是关键的时间,但因为在不同的模式下生成图片的精细度时间不同,没有强调极限时间。

GPU支持光线追踪,但普及尚需时日 

除了全大核CPU和NPU的升级,天玑9300其它方面的升级略显常规。

天玑9300勇闯全大核CPU、端侧大模型时代

虽然天玑9300的GPU采用了12核GPU Immortalis-G720,与上一代相比,峰值性能提升46%,相同性能下功耗节省40%。并且在联发科技第二代硬件光线追踪引擎的支持下,能够支持60FPS高流畅度的光线追踪,并带来游戏主机级的全局光照特效。

天玑9300勇闯全大核CPU、端侧大模型时代

天玑9300勇闯全大核CPU、端侧大模型时代

但PC端和游戏主机的光线追踪都还没有普及,在手机端普及的挑战更大,普通游戏玩家短期内不容易感受到巨大的变化。

不过联发科还是在推动移动端光线追踪GPU技术的发展和普及,和大量的合作伙伴合作。 

联发科技特有的MAGT游戏自适应调控技术升级为“星速引擎”,不仅与游戏应用广泛合作,还将拓展更多类型应用的生态合作。

天玑9300勇闯全大核CPU、端侧大模型时代

其它升级

天玑9300勇闯全大核CPU、端侧大模型时代

长按图片保存图片,分享给好友或朋友圈

天玑9300勇闯全大核CPU、端侧大模型时代

扫码查看文章

正在生成分享图...

取消
相关文章