2023年,大模型的出现带火了整个算力行业。
从行业发展的角度,算力已然成为全行业竞争的高地,似乎谁能拥有更多的算力,谁就能掌握更多的主动权,无论是大型企业还是中小企业都希冀于通过获取高质量的算力,谋求新的业务创新,创造新的增长点;从数字经济发展的角度,算力作为一种新型生产力,已成为推动数字经济发展的核心力量,正强有力地支撑数字中国建设。
基于此,国内企业也开始进行算力产业的布局,《2023胡润中国数字技术算法算力百强榜》显示,企业价值在1000亿以上的企业共29家,其中腾讯控股、阿里巴巴、中国移动、抖音、华为、美团、蚂蚁科技、比亚迪、拼多多、京东进入榜单前十。
从多方的支持下,较以往几年,近两年我国算力产业的发展明显提速,据工信部数据显示,截至2022年底,我国基础设施算力规模达到180EFLOPS(每秒18000京次浮点运算),算力核心产业规模达1.8万亿元。另外,随着数据中心、智能中心、超算中心等新型基础设施加快部署,预计2023年中国基础设施算力规模将增长至231EFLOPS。
但随着AI、大数据等新型技术的迭代,企业对算力的需求不仅仅局限在基础算力层面,还对智算、超算有了很大的需求。从目前的算力市场结构看,受益于AI服务器需求的爆发,智能算力超过基础算力成为我国算力规模增长的主要驱动力。
而近两年的算力需求的变化也是最好的例证,据中国信息通信研究院数据,2021年中国智能算力规模、基础算力规模、超算算力规模分别为104EFlops、95EFlops、3EFlops,分别占比51%、47%、1%。随着生成式AI的发展以及人工智能大模型的应用落地,预计未来智能算力规模占比将进一步扩大。
基于此,我国在算力基础设施扶持政策方面也在不断调整。早在2013年到2016年,国家出台的数据中心指导意见明确将全国划分为四个区域,引导算力向更绿色,更集约的地区布局,2017年到2022年,在数据中心不断优化布局的基础上,提出了绿色数据中心的发展要求。
2023年,《算力基础设施高质量发展行动计划》则提出了很多关于完善综合布局,提升算力高效运载的指导意见。
也就是说,通过十年的跨越,在政策和需求双轮驱动的作用下,算力基础设施即将进入高质量发展阶段。
何为高质量发展?这个阶段又会出现哪些明显的特征?
中国信通院产业与规划研究所副总工程师王青拆解道,其一,多元泛在。随着人工智能、大数据等等技术的发展,我们的通用算力、智能算力等协同发展供给体系越来越显现。怎么样实现多元异构泛在的算力,是未来高质量发展的重要特征。
其二,智能敏捷。无论是东数西算、一体化大数据还是国家数据局的成立,都是为了推动算力成为像水和电一样的基础资源。在这种情况下,算力必须拥有像水电一样弹性调度的优势,能根据用户需求满足多层次算力调度的体系,让算力更泛在化,算力资源和需求能够精准对接。
其三,普惠赋能,算力最终是要和千行百业、实体经济相融合,在融合的过程中,帮助企业创造价值。
其四,绿色安全,随着算力需求的持续攀升,绿色化、低碳化对于算力的发展越来越重要,怎样提高算力基础设施的能源效率和低碳水平已然成为了重要课题。
与前三者相比,算力的绿色发展正在成为企业和社会关注的焦点话题,因为算力的持续攀升往往会带来高能耗问题。
通用算力方面,以CPU为例,CPU能耗已经从2019年的205瓦,演进到2022年的400到500瓦的规模,但是以传统风冷的散热方式,400瓦以上就会遇到一个巨大的挑战。
智算方面,尤其是异构计算,用于AI 的GPU芯片的功耗已经从2017年的300瓦左右的规模,演变到2022年的700到800瓦的规模。而且单机芯片密度更高的GPU,在散热方面会遇到更大的挑战。
王青介绍道,根据测算,如果芯片的尺寸演进到10纳米,整个芯片的性能提升一倍,它的功耗至少要提高30%到40%,也就是说,散热能力决定了芯片的性能发挥,所以散热能力对芯片性能的发挥至关重要。
由此可见,高能耗已然成为当前算力带来高价值驱动力背后不可忽视的问题。所以绿色算力就成了算力高质量发展的重要目标,是算力的绿色低碳追求。
那如何实现算力的绿色、可持续发展,一下成了迫在眉睫的事情。
其实反观近几年国家对算力的绿色发展,一直处于高度重视的程度,无论是政府还是各行业企业都做了大量的工作。
政府侧,工信部出台的《新型数据中心发展三年行动计划(2021—2023年)》提出,要加快提升算力算效水平,加快高性能、智能计算中心部署,推动CPU、GPU等异构算力提升,逐步提高自主研发算力的部署比例,推进新型数据中心算力供应多元化,支撑各类智能应用...
2022年8月,工信部等七部委联合印发《信息通信行业绿色低碳发展行动计划(2022—2025年)》,提出到2025年,全国新建大型、超大型数据中心电能利用率(PUE)降到1.3以下。
2023年《数字中国建设整体布局规划》提出,要系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,到2025年基本形成横向打通、纵向贯通、协调有力的一体化推进格局。
企业端,诸如中国联通GPU资源编排调度赋能绿色AI智算,通过打造AI算力绿色节能调度系统,对AI算力的IT系统能耗进行全生命周期的细颗粒度管控,对AI算力进行能耗压降。
中国电信选择与能源企业合作,打造数字青海绿色大数据中心,自建分布式光伏+电化学储能的绿电供应系统,是全国首个100%清洁能源可溯源绿色大数据中心。
中国移动呼和浩特数据中心结合政策指引、内部偏差控制、准确掌握电力市场动态及时交易和调整等举措,避免核减绿电使用量,最大限度提高绿电使用比例。
浪潮信息则围绕了绿色计算多维度的标准和整个全生命周期,构建了丰富多元的评价体系和标准建设,以推动绿色计算的产业化发展。标准建设方面,出台了相应的技术标准指引和白皮书,评价体系方面,研发了大量绿色测评的工具、规范以及报告;绿色计算技术方面,贯穿绿色采购、绿色设计、清洁生产,到绿色包装运输、绿色运营、回收处理等整个全生命周期做了技术方面创新,来推动绿色计算的发展。
但是最值得一提的是,近段时间,浪潮信息还与英特尔联合发布了全球首个全液冷冷板服务器参考设计,并面向业界开放,为全球液冷产业链上下游提供极具价值的参考样板,推动先进全液冷冷板解决方案在全球数据中心的大规模部署应用,实现数据中心更加绿色低碳可持续发展。基于该参考设计,浪潮信息推出全液冷冷板服务器,实现服务器部件接近100%液冷散热,达到PUE值接近于1的极致水平。
究其原因,IDC数据显示,冷板式液冷已经成为液冷数据中心的主流,在中国液冷服务器市场中的占比达到90%。
随着AIGC时代的到来,对CPU、AIPU、内存、存储等各类IT资源的部署密度提出更高的需求,传统风冷制冷模式在换热性能及能耗优化方面逐步受限,全液冷冷板技术将成为大规模、高密度数据中心特别是智算中心的必然选择。
然而,目前由于液冷产业标准不完善,产业链上各个企业技术路径多种多样、产品规格千差万别,产品质量良莠不齐,各液冷模块无法兼容,让用户难以选择,获取成本和使用门槛高,液冷产业发展面临阻碍。
而此次浪潮信息与英特尔联合开放的全液冷冷板服务器参考设计,主要做了两方面的革新:
一方面,基于双方在液冷技术领域的创新能力,从系统级解决方案出发,以模块化解耦设计思维,兼容不同厂商和型号的计算设备,探索高能效、易于运维、使用更安全,兼容性更出色的全液冷冷板服务器设计;另一方面,通过设计开放,对产业探索全液冷冷板解决方案,提供新思路,加速全液冷冷板技术的普及和规模化应用,推动产业化进程。
可以说,在这个过程中,双方均发挥了自身的优势,浪潮信息和英特尔凭借着在绿色低碳方面的实战经验和积累的技术经验,实现了1+1大于2的效果。
在全液冷冷板技术方面,双方共同探索,实现了液冷模块解耦、冷板结构全局设计等创新突破,并面向全产业进行开放,为蓬勃发展的液冷产业生态注入新的创新活力,打通了液冷规模化应用的最后一公里。
雷峰网了解到,此次浪潮信息推出的全液冷冷板服务器,实现了对CPU、高功耗内存、NVMe 硬盘、OCP 网卡、电源、PCIe 转接卡和光模块等服务器主要发热部件的冷板全液冷覆盖,PUE降至1.05以下,并通过“去空调化”节省30%以上的数据中心空间,充分满足数据中心的高密度部署需求。
同时,该产品针对不同部件的结构、材质、工作温度等差异化需求,创新设计了诸多系统部件级液冷解决方案,包含PSU、内存、硬盘、扩展模块等,灵活性更高,用户可以按需选择。
其中,首创的内存枕木散热器液冷方案结合了传统风冷散热和冷板散热的优势,比现有的管路(Tubing)内存液冷方案,更加易于组装和维护,且通用性更强。凭借这些创新的液冷解决方案设计,浪潮信息全液冷冷板服务器将为客户提供极致PUE的算力系统,助力客户在AIGC时代构建更加绿色低碳的数字基础设施,并推动液冷产业在全液冷冷板技术这一新兴技术领域的实践与探索。
(雷峰网雷峰网(公众号:雷峰网)雷峰网)