数字经济时代下,AI人工智能显然已经成为产业数字化转型“枢纽”。从语音识别到人脸识别,从自动驾驶到精准医疗……近年来,人工智能的发展为人们所熟知,而这背后都有赖于算力的支持。
算力,就是计算的能力。两位数乘法,有的人需要几分钟,而有的人只需要十几秒甚至几秒,那么显然后者的算力强。
算力越强、算法越优,人工智能就越牛。但是AI人工智能是一个算力大户,尤其"吃"算力。算力已经成为继热力、电力之后新的关键生产力。
近日IDC与浪潮信息联合发布《2022-2023 中国人工智能计算力发展评估报告》(以下简称《报告》)。这是IDC连续第五年发布全球计算力指数评估报告。
那么今年,产业发展趋势如何?中国人工智能计算力行业应用如何?在地域、行业应用等方面有什么不同表现?智能算力的技术架构及市场发展又有什么样的新趋势?会后雷峰网(公众号:雷峰网)和相关媒体与浪潮信息副总裁刘军、IDC中国副总裁周震刚进行了深入的交流。
中国AI产业的变与不变
今年已经是IDC研究中国AI发展水平的第五个年头,五年来,AI产业有不变的,有变化的。周震刚表示:“AI产业不变的是国家产业政策的支持和投入以及用户对AI技术领域的热衷;显著变化的是,AI越来越普惠化、基建化。”
IDC数据显示,2022年中国人工智能市场相关支出达到130亿美元,有望在2026年达到267亿美元,2022至2026年年复合增长率达20%。
AI虽然作为数字经济的重要驱动力蓬勃发展,但是数据显示,当前AI在全行业整体渗透度不断提升。这背后需要强大的智能算力的支持,抬高了AI研究和应用的门槛。
人工智能的发展需要巨大的算力支撑。业界普遍认为在AI算力发展方面存在着标准规范不一致、软件调度能力弱、算力分配不均匀等痛点,分布在场景化落地过程的方方面面。
而人工智能计算中心提供的高性价比的、安全、普惠的算力资源,可大幅缩减各类组织的算力成本,缓解甚至彻底解决算力瓶颈问题。目前,国家大力推动新基建和数字经济,加上持续的利好政策,现在,国家8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,协调区域平衡化发展,推进集约化、绿色节能、安全稳定的算力基础设施的建设。
一方面有国家政策、新基建、数字经济等对AI的推动,另一方面行业自身的热度,都让中国人工智能计算力快速发展。
《2022-2023 中国人工智能计算力发展评估报告》指出,中国人工智能计算力继续保持快速增长,2022年智能算力规模达到268百亿亿次/秒(EFLOPS),超过通用算力规模。预计到2026年中国智能算力规模将达到1271.4EFLOPS,未来五年复合增长率达52.3%,同期通用算力规模的复合增长率为18.5%。
据周震刚介绍,这一年,AI整体规模不仅发生变化,从底层的芯片到服务器系统、算法架构、云服务应用以及整个生态都发生了很大的变化。
从人工智能芯片角度来看,芯片市场变得越来越重要。预计到2025年人工智能芯片市场规模将达726亿美元。人工智能逐渐从核心向边缘扩展,人工智能芯片的搭载率以及搭载密度也会不断上升。从类型来看,中国仍然是GPU为主的市场,市场占有率近90%。另一方面,从供应链来看,由于政策及疫情原因,芯片从国际采购转向本地的采购、本地研发成为一个重要的趋势,国产的GPU和NPU的厂商有了新的发展空间,增长快速。
AI服务器是人工智能市场增长的主力军。其实从整体服务器市场来看,整体服务器市场基本上跟去年持平,不是很景气。但人工智能服务器的增长速度仍然是两位数,增长喜人。从全球来看,中国和美国在人工智能服务器上面的投入远远高于其他国家,这两个国家各自的投入均高于其他国家的总和。从服务器厂商角度来看,浪潮仍然占据中国AI服务器市场超过一半的供应量。
从系统算法架构的角度,异构计算越来越普遍,异构计算时代,企业计算系统节点规模快速增长,系统中数据搬运的成本开销已经成为不可忽略的问题,计算节点内以及节点间的互联技术已经成为现有计算架构的关键瓶颈。如何充分调动起多芯片、多板卡、多节点的系统级能力,实现CPU同各种加速单元以及跨节点系统的高效协同以提升计算性能,受到业内的广泛关注。
异构计算成为主流趋势,未来18个月全球人工智能服务器GPU、ASIC和FPGA的搭载率均会上升,算力多元化发展趋势明显。
计算体系架构的黄金时代
这个时代是计算体系架构的黄金时代。
当问及为什么GPU在中国市场占有率很高,达到90%?
刘军回答道:“GPU占比比较高,实际上主要来源于在过去十几年在软件生态上面的投入,使得GPU生产效率、生产力工具方面,竞争力非常强,形成了全球一体的开发社区,支撑了整个人工智能产业。同时这又为后来者在芯片创新上提供了很好的经验,比如如何培养自己的软件、支撑开发者、社区和产业融合。”
从整个计算体系架构来说,GPU实际上在加速计算,因为AI需要非常强大的训练计算性能,以及非常高能效比的推理计算性能,而GPU的技术创新是最活跃的。这些技术创新都发生在AI计算领域,AI是这些技术创新的试验田,例如内存计算、量子计算。
换一个角度来看,中国做AI芯片的有将近一百多家公司,不仅是GPU出于供应链的角度看芯片,未来几年,中国的人工智能芯片会更加丰富多样化。
人工智能给了计算架构创新一个非常肥沃的土壤,滋养了整个计算体系架构的创新和繁荣。
根据《报告》显示,中国人工智能服务器在边缘端和推理端增速非常快。从2020年开始,人工智能服务器推理端的量已经超过了训练端。
周震刚表示,因为现在越来越多的人工智能应用需要实时的本地化处理,在边缘侧做推理应用的机会就多了起来,例如工业行业当中的一些质量监测、监测视频的分析,就需要在端侧完成,不然预警处理不及时。
在刘军看来,边缘端人工智能服务器快速增长也说明中国的人工智能应用推进速度很快,越来越多的行业和场景把人工智能当作生产力提升的手段,在业务全链条中做了应用和部署。从整个业务全流程来看,一定会有很多边缘端的数据的采集、数据的处理。另一方面,边和云相辅相成,更多的边缘会催生更大的云端需求来处理来源于边和端的数据。边缘端的增长也更加有利于推动云端需求的发展。
产业AI化的趋势愈加显著
据《报告》所述,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造。与21年相比,行业AI渗透度明显提升。
周震刚表示,一方面金融、电信有比较大的增长,未来实际上是智能制造、智慧医疗,都是新的可发展方向,例如在智能制造方面,设备管理、预检测、维修预测、质量监控等等在制造业越来越普遍的应用。同时我们也看到人工智能也更多的参与到科研里面去,通过人工智能去处理科研的大数据模型分析。
特别要强调的是,人工智能在互联网应用,仍旧远远超过其他行业。虽然去年互联网行业投资有所放缓,但是相应的人工智能方面,甚至客户有可能到其他行业的,比如数字人、NLP、智能创作等,都是互联网行业发展的。以及现在的大模型的落地,都是互联网通过大数据来训练产生。
从场景应用维度看,智能化场景在行业的落地随着时间的推移,正呈现出更加深入、更加广泛的趋势。目前人工智能在智慧科研、智能制造、自动驾驶、AIGC、智慧医疗、智慧电信、智慧能源、智慧交通、生物识别等场景均有应用。
谈及AI在产业落地方面,刘军表示:“AI是一个基础性的技能,和产业本身的结合需要一个过程,很难明显的看到颠覆性的对产业的改变。现在非常显著的变化是AI产业化,把AI的能力、AI的技能变成一个产品、变成一个产业,能够去创造一个新的产业出来,这个变化是非常大的。如果把AI市场看作一个冰山模型的话,我们看到的只是浮出水面的10%,而水下的90%还需要和产业进行深度的融合,也就是产业的AI化。”
但是要看到冰山下面90%,需要跨越的鸿沟是巨大的。因为技术发展非常快,一日千里。但是拥有这种技能的人和企业,少之又少。这样就造成一个结果,顶尖的技术能力走的很快,但是产业的绝大多数,不具备这样的能力,这个鸿沟很难跨越的。
周震刚认为,要跨越产业能力跟不上AI技术发展这一难题,最重要的是让AI普惠化、基建化,让整个产业链从上游到下游都还能够更加容易应用到AI技术。例如通过规划智算中心,让一些AI初创企业可以更容易的获取到AI的算力,支持他们的创新,让更多中小企业能用到AI平台、AI的算力。另一方面就是训练大模型,把AI最前沿的能力变的更加普适化。
深度学习技术兴起的近10年间,AI模型基本上是针对特定应用场景需求进行训练的小模型。这种作坊式开发对资源、成本造成较大消耗,且效率低下。而AI大模型具备很好的泛化能力,可以打造出具有通用性质的人工智能,一个模型可以支撑各类不同应用,有效缓解碎片化开发反复建模的困境。比如浪潮“源1.0”大模型开放的API、开源的应用代码等,使开发者无需关心底层技术,设置无需配置编程环境,就可以直接将应用构建于AI大模型的能力之上,在降低开发门槛的同时,让开发人员能够将更多的精力聚焦核心业务逻辑。
大模型是加速AI产业化的一剂良药。
据刘军介绍,浪潮一直倡导元脑生态的理念。有的伙伴具备非常强的AI能力,我们称之为左手伙伴;能够覆盖千行百业的SV、SI伙伴,称之为右手伙伴。因为浪潮有算力平台、算法平台、资源平台,所以通过平台的方式,把生态伙伴牵到一起,“左手”拉“右手”一起实现顶尖的AI创新能力,从而推动AI能力广泛的落地,形成商业闭环。
1943年,IBM董事长托马斯·沃森曾预言:“我想,5台主机足以满足整个世界市场。”今天我们恨不得一个人好多台计算设备。刘军说,计算产业就是这样,只有拥有更大的算力、更大的模型、更大的可想象的方法的时候,才会做到更多以前做不到的事情,所以随着计算能力的发展未来AI一定更加普惠化。
刘军告诉雷峰网,不要给技术设限,按照十年一个窗口期。我们今天可能耗资巨大所打造的大模型智能的计算力,到了未来可能也是一个普通的机器。今天只有极少数大公司才能拥有的算力,在10年后我们每个人都能拥有,每个人都能拥有自己的一个大模型,作为专有智能助手。