“我们正在进入将改变用户体验的生成式AI时代,也将创造移动行业和计算行业的全新周期。”高通公司总裁兼CEO安蒙在2023骁龙峰会上的这句话概括了高通面对的机会。
对于全球极少既能做好连接,又擅长计算的高通来说,生成式AI是拓展手机之外市场份额的绝佳机会。
移动连接这个刻在高通基因里的技术,高通已经做到了极致,拥有绝对的领导力。但计算对于高通来说还有很大的市场空间,比如PC、XR、汽车。
生成式AI恰好是给PC和汽车行业带来变革的技术,这也是2023骁龙峰会的重头戏,全新发布的4nm Oyron CPU、第三代骁龙8,最大的亮点都是高性能、高能效、强AI。
Oyron CPU超越了x86阵营里的最强者,也力压震撼业界的苹果M2 Max,确实是一款让人惊艳的产品。
但换个角度,高通在Arm PC领域耕耘几年收获不算丰硕,碰上了生成式AI的机会,必须拿出一款极具竞争力的产品,才有可能拓展其优势领域,给消费者和投资者更大的想象力。
高通未来的潜力藏在Seamless里
Oyron CPU和第三代骁龙8绝对是值得最先介绍的产品,但要看清楚高通未来的机会所在,还是从骁龙Seamless说起。
高通技术公司高级副总裁兼手机、计算和XR业务总经理阿力克斯·卡图赞这样介绍,“骁龙Seamless是一个促进多终端体验的重大飞跃,真正打破生态系统壁垒。”
德勤发布了一个《2023年网联消费者调查》,调查报告指出了每个美国家庭目前平均拥有21台数字化终端,不同终端之间,尤其是不同制造商的终端之间信息传输通常并不顺畅的问题。
骁龙Seamless为这个解决问题而诞生,要让不同系统、不同制造商的智能手机、笔记本电脑、平板电脑、耳塞、智能手表和XR设备的自组织智能网络,共享信息等。
有了Seamless,安卓手机的照片可以直接拖到Arm处理器的Windows电脑上,还能直接用Windows电脑的鼠标操控复制文本到另一个品牌的平板电脑。
Seamless包含硬件和软件框的整体解决方案,基于高通的低功耗、低时延、蓝牙、Wi-Fi以及传感器中枢。
“我们与微软和Meta的合作,让大家看到了Android与Windows合作,将终端保留在一个封闭式生态系统里已经过时。”安蒙继续说,“人们可以选择自己想要的终端,而不是他们被允许选择的终端,这对于整个行业都是一个激动人心的时刻。”
如果Seamless能够真正打破生态系统壁垒,让不同OEM厂商、生态系统和操作系统更紧密的整合,这将会是一个双赢的解决结果。
消费者享受到了便利,拥有了选择权,高通能够将其强大的影响力从手机拓展至PC、汽车、XR设备领域。
换句话说,如果高通抓住了生成式AI带来变革的机会,Samless获得成功,高通就占据了进可攻退可守的有利位置,保持手机市场领先地位的同时,也能抢夺AI PC的市场机遇,还能享受XR和汽车这两个新增市场的红利。
Samless取得突破需要时间,高通没有坐等好运的降临,先用Oyron CPU主动出击。
必须拿出惊艳市场的定制Oyron CPU
高通在今年拿出的Oyron CPU确实让人惊艳,这并非高通的第一代Arm架构PC端CPU产品,可以说高通此前在PC领域的几代产品的尝试都算不上大获成功。
原因有很多,比如处理器性能和能效不足够打动客户,没有包括微软在内的软件和应用生态的全力支持。
但情况已经发生了变化,苹果用M系列芯片惊艳了市场,让消费者意识到Arm架构的PC处理器可以有比x86更高的性能和更低功耗,也让高通更清楚应该推出一款性能和能效足够惊艳的Arm CPU,其收购的Nuvia也加强了其设计高性能Arm CPU的能力。
对高通来说,在PC CPU领域大量投入还有一个更重要的理由,AI迎来了iPhone时刻。如果只是去替代x86 CPU,即便PC市场体量足够巨大,也只是一个存量市场,缺乏足够的想象力,AI爆发将给这个市场带来增长,所以高通看准的是AI PC的机会。
阿力克斯·卡图赞就表示,“未来用户在进行PC购买决策时,除CPU和GPU之外,还会考虑AI的性能和应用。”
所以,要震撼业界,就需要有业界最强大的CPU、GPU和NPU。
高通确实做到了,Oryon CPU超越了性能和能效顶尖的苹果M2 Max,实现和M2 Max相同的单线程性能,Oyron CPU能耗减少30%。
Oyron单线程性能对比x86阵营CPU,超过了专门为高性能游戏终端而设计的i9-13980HX,实现相同性能功耗降低70%。
搭载定制Oyron CPU的全新骁龙X Elite多线程CPU性能也十分惊艳,Oryon的峰值性能比x86阵营竞品的高端十四核笔记本电脑芯片的峰值性能高60%,实现相同性能功耗能降低65%。
如果对比同为Arm架构的M2 Max CPU性能,Oyron的峰值性能高50%。这得益于Oyron的架构设计,其中的双核增强可以加速12个高性能CPU内核的2个,从而为用户提供超快响应。
“这不仅是骁龙、高通的高光时刻,也是整个Windows 生态系统的高光时刻。”安蒙说,“消费者不再需要在性能和能效之间做选择,可以两者兼得。厂商可以将骁龙X Elite应用于广泛的PC设计和配置,大家将看到我们拥有业内最出色能效的CPU。”
高通会把Oyron CPU的能力带到更多产品线,明年应用到骁龙8平台,此后会进入汽车、XR等产品线。
骁龙X Elite的 GPU性能也碾压竞品,在面向PC的热门3D图形基准测试显示,与性能领先的x86集成GPU相比,骁龙X Elite的性能领先高达80%,达到竞品的最高性能功耗可以降低80%。
如此惊艳的CPU性能和能效确实对消费者具有吸引力,但能够刺激消费者购买新PC的关键还是在AI。
骁龙X Elite的Hexagon NPU算力可以达到45 TOPS,性能达竞品近期发布NPU的4倍。融合CPU和GPU的AI引擎可以让骁龙X Elite的AI性能达到75TOPS。
6年时间,骁龙计算平台的AI性能就提高了100倍,这种指数级的性能提升带来的是全新的AI应用体验。
“TOPS不是量化终端侧AI性能的唯一方式,还要考虑AI模型的准确性和响应时间,以及用每秒生成token(tokens/s)来衡量的大语言模型处理速度。”阿力克斯·卡图赞分享了在搭载骁龙X Elite笔记本电脑上运行AI助手发挥出的强大算力。
骁龙X Elite的AI助手以30 tokens/s的速度,在终端侧运行70亿参数的Llama 2模型,实现快速准确的响应。
把这个速度具象一些,普通人每分钟可阅读约200-300个单词,相当于每秒处理5-7个tokens,也就是骁龙X Elite终端AI的书写速度比普通人的阅读速度更快。
阿力克·斯卡图赞介绍,“骁龙X Elite能够实现这一性能水平,得益于高通AI软件栈的大幅进步。在不影响准确性或性能的情况下,利用INT16、INT8、INT4等量化巨大的生成式模型,大幅节省功耗并减小内存占用。”
雷峰网了解到,在搭载骁龙X Elite的终端上可以运行超过130亿参数的生成式模型,无需云端资源。
有了强大的AI性能,就可以在AI PC上起草完整的电子邮件、转录会议记录,或者借助文本生成和图像生成工具快速进行研讨。
无论对于个人还是对于企业来说,AI PC都是提升效率的工具。
“通过使用现代AI PC,用户在骁龙终端上进行的处理越多,就能节省更多的云计算成本。”阿力克·卡图赞强调了云端和终端混合AI的价值。
但即便有微软、联想和HP的支持,Arm架构处理器运行Windows系统依旧面临着应用性兼容和生态等问题。
如果应用不是原生移植到Arm端,就必须通过转译的方式才能运行。另外,由于Arm PC对于Windows生态系统是较新的架构,PC的硬件生态系统,包括摄像头、鼠标、打印机等外设也会存在适配问题。还有,PC生态系统中常用的ODM厂商,过去几年适应了各种PCB和元器件的设计和生产,Arm PC也需要适应这些硬件生态系统。
阿力克斯·卡图赞对雷峰网(公众号:雷峰网)表示,“通过高通的努力以及与微软的合作,我们成功地把很多热门应用移植到了Arm平台上。此外,我们还与微软合作,用户在转译模式下运行应用,将拥有和原生应用一样的使用体验。微软也在帮助我们改进生态系统中的应用兼容性,高通设立了一个庞大的团队,致力于提升硬件生态系统的兼容性。”
目前,微软的生产力应用,包括Word, Excel, Powerpoint, Edge, Teams, OneDrive, OneNote和Outlook等都是Arm原生。
另外,高通还给出了骁龙X Elite的三个参考设计,有利于OEM厂商更快推出产品,搭载骁龙X Elite的PC最早将在明年上市。
第三代骁龙8驱动手机大模型普及
Arm PC是高通在短期内可以期待的新增长点,这个增长幅度在短期内将更加巨大,特别是有高性能、高能效以及AI的吸引力。
与PC一样,手机终端运行大模型也是一个明显的趋势,谷歌以及各大手机厂商都在探索手机端运行生成式AI模型的无限可能,这也是生成式AI给手机带来的变革。
虽然因为全新Oyron CPU和骁龙X Elite的发布,往年骁龙峰会的主角骁龙8的风头被抢走不少,但第三代骁龙8的升级并没有打折。
第三代骁龙8的CPU相比上代骁龙8,CPU性能提升高达30%,GPU性能提升25%,Hexagon NPU性能翻倍,集成最快的蜂窝调制解调器、最先进的Wi-Fi 7解决方案,和双蓝牙技术。
所有子系统都进行了升级,重点在AI和影像两个方面。
AI引擎的升级是得益于采用了增强架构提升能效,也面向生成式AI大幅提升了Hexagon NPU性能,使第三代骁龙8能够更好支持大语言模型、大视觉模型以及生成式AI应用。
这种升级带来了非常显著的提升,今年初高通在骁龙8终端上采用Stable Diffusion进行图像生成时需要超过15秒,在最新的第三代骁龙8上,运行这一模型仅需要0.57秒,这是一个跨越式的进步。
目前,第三代骁龙8能够在手机上运行100亿参数的生成式AI模型,以20 tokens/s的速度运行大语言模型。
小米已经在第三代骁龙8上能流畅运行自研的60亿参数大模型(6B)。
“小米自研的6B大模型,目前可以实现媲美更大参数量模型的能力,能够用于知识问答、文字扩写、表格生成、编写代码等。”小米集团总裁卢伟冰在骁龙峰会上介绍,“我们在端侧实现了不可思议的运行速度。面对1000 tokens的指令,生成首词只需要2.2秒,这是因为我们应用了业界最前沿的推测性解码技术。”
AI的升级也能够直接提升第三代骁龙8的影像水平。
比如,高通的合作伙伴慧鲤科技,面向第三代骁龙8开发了一个神经网络,能够重构照片缺失的部分,这一特性被称做“照片扩充”。如果一张照片就是朵花,能由AI“扩充”出一片花海。
有AI创作的美图,就需要识别AI图片。高通与Truepic合作,能够利用Snapdragon Security进行图片加密盖章,标示照片的真实性。
这些只是一部分端侧生成式AI应用,第三代骁龙8 AI性能的升级,让更多个性化的AI体验的实现成为可能,例如制定个性化的运动方案,更懂使用者的语音助手,基于使用者位置的餐厅和路线推荐。
“通过在终端侧运行这些强大的大型模型,用户无需再完全依赖云端。”阿力克斯·卡图赞强调,“在第三代骁龙8上,AI辅助特性将响应更快、更高效,并且由于在终端侧运行,所以更加隐私和安全。”
2023骁龙峰会,应该是截至目前含AI量最高的一届峰会。虽然高通没有大呼All in AI,但从今年所有新品都大幅升级了AI性能,时时刻刻都展现了混合AI的价值,以及AI无处不在的未来。
对于高通来说,在端侧AI保持领先,在手机市场是守住基本盘,在PC市场是进攻的好机会。
如果实现Seamless的愿景,那汽车、XR以及其他新兴市场都将是高通未来的爆发点,那时候将无处不在的骁龙终端将从3亿个,实现跨越式增长。