2022年2月起,“东数西算”工程全面启动,一大批数据中心项目或开工建设或投入运营, “东数西算”新型基础设施建设正加快推进。据国家发改委数据显示,截至2022年4月,在全国10个国家数据中心集群中,新开工项目达25个,数据中心规模达54万标准机架,算力超过每秒1350亿亿次浮点运算,约为2700万台个人计算机的算力,带动各方面投资超过1900亿元。
其中,西部地区投资比去年同期增长6倍。预计“十四五”期间,大数据中心投资将以每年超过20%的速度增长,累计带动各方面投资超过3万亿元。
众所周知,数据中心行业是“能耗大户”。据资料显示,全国数据中心用电量占全国总用电量在2020年(消耗总量为2045亿千瓦时)和2021年(消耗总量为2166亿千瓦时)的比例分别为2.71%和2.6%。
相关权威专家测算和预计,到2025年,全国数据中心能源消耗总量将达到3500亿千瓦时,约占全社会用电量的4%,到2030年,全国数据中心能源消耗总量5915亿千瓦时,占全社会用电量5%以上。在如此庞大的用电量之下,能耗成本将呈现显著增加的趋势。
另外,随着算力的发展,CPU功耗也在不断提升,这带来服务器功耗逐步上升。与此同时,云计算、边缘计算、人工智能等技术应用对数据中心功率密度的需求逐步升高。
在碳中和和东数西算的政策指引下,数据中心则需要从节能减排的角度出发,用实际行动实现“双碳”目标。绿色节能数据中心的建设,一部分要靠改变制冷手段实现,从现在的用电制冷,改为自然风冷、水冷及液冷。
由于这些手段的实施受地域因素影响较深,为进一步提高节能减排效率,在数据中心内IT设备优化能耗水平也极其重要的,能效比的提高,可以为建设绿色节能数据中心贡献自身的力量。
目前针对数据中心内IT设备效能的优化推进工作正面临着亟待解决的问题。
一方面,专注在数据中心IT设备领域的芯片或者产品承担着快速迭代的压力,这些压力来自于业界顶尖的一些超大型数据中心技术演进的要求,其代表了数据中心领域IT设备的最高规格。同时,市场上还会有数量庞大的中小型或企业级数据中心,他们看待数据中心的建设及技术要求与上述超大型数据中心截然不同。如何保持两种市场均有竞争力,是很多数据中心芯片或产品公司需要考虑的地方。
另一方面,数据中心IT设备领域各组件又会相互依赖和影响。不论规模大小,整个数据中心IT设备领域是一个极其复杂的系统工程,以计算、网络、存储为三大核心,周边又涉及到十几个大大小小的配套领域。一个领域出现滞后,均有可能对整系统造成影响。举个例子,一款CPU的PCIe总线速率如果不能从3.0 x16升级为4.0 x16,则无法真正发挥2x100G网卡的能力,2x100G网卡出货量及市场占有率会受影响,进一步影响数据中心网络400G/100G及配套光模块的出货量。
由于计算、网络、存储拥有完全不同的物理性能增长曲线,但三者之间又各自依赖,往往无法发挥各自最高性能,此时就需要对现有IT基础设施架构的搭建进行重新的思考。而DPU,正是因现有传统技术架构无法满足底层数据处理任务(包括网络、存储、安全等)发展需求而产生的专用处理单元。
在现有数据中心基础架构中,除以GPU为代表的专用异构计算处理单元处理异构计算类任务外,作为专注于处理通用计算类任务的CPU,还需要承担包括网络、存储、安全等任务,这让CPU“不堪重负”,有效算力在总体算力中的占比逐渐下降。DPU的功能和作用正是分担CPU在传统基础架构中所承载的基础数据处理任务,其专门负责网络、存储和安全相关的处理任务,进而大大解放CPU的计算能力。
由此看出,DPU设计理念就是为了提高数据中心IT设备的能效比,使用有针对性的硬件设计,集中度更高的处理体系,把原先的基础数据处理的能耗降低,从而实现整体能效比的提高。专用芯片和加速器的广泛应用,在处理效率上肯定会比通用处理单元更优,这是业界普遍的共识。
如何定义专用芯片及加速器,与现有通用处理单元配合,是考验功力的地方。DPU是场景化的产品,能够让DPU在更多的场景下发挥特长,才能最终体现在提高能效比这个结果上。为此,在数据中心的应用上,DPU作为数据中心领域的新晋者,不光要从自身功能出发,同时也需要最大化适配周边合作组件的状态和技术趋势。
在 “东数西算”政策推行下,如何优化算力效率则是关键。算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。“东数西算”工程在于更好地促进算力、数据流通,激活数字经济活力。东数西算政策的出台,本质上是在算力和数据两大生产要素之间实现高效供给。
一方面,算力作为生产工具,需要更高效地提供数据处理能力,整体数据中心单位能耗下提供的有效算力是衡量数据中心能效比的最直观指标。有效算力是指除去必要的算力损失,而真正能够用来计算或处理数据的算力。另一方面,数据作为生产资料,在完成数据采集后,数据需要在算力之间流转,才能使数据产生价值。在传统实现方式中,需要通过消耗一部分算力来实现数据流转,但这样必然会大幅降低上述的有效算力能效比。
针对上述两方面,利用DPU这一专用处理器的特点,在数据中心范围内使数据能够高效地在算力间流转,大幅减小数据中心内算力开销,在提高有效算力水平的基础上,更高效地实现数据流动,实现“一举两得”。
东数西算是从国家战略、技术发展、能源政策等多方面出发,在“新基建”的大背景下,启动的一项至关重要的国家工程。“东数西算”政策实施的核心是对数据与算力的重新分布,其中涉及到大量数据在不同算力间的流转,数据的流转主要分为数据中心内部及跨数据中心两种场景,而DPU可在数据中心内部流转这一环节中“大有可为”。而在当今大产业背景下,国产化迎来了新开端,DPU作为“新起之秀”,在“东数西算”的政策推行下,将为国内DPU行业提供更多的落地机会。
为此,对国内熟悉数据中心/云计算场景的资深DPU企业和团队是一个很好的机会,因其能够更深理解DPU在“东数西算”政策下使用场景的真实需求,更快做出相应,更好地制定出符合用户需求和业务场景的完整DPU产品。大禹智芯拥有完整DPU技术研发和商业落地经验的队伍,将结合自身多年在云计算行业的技术积累和对DPU类产品的充分理解,积极参与到“东数西算”建设中。
大禹智芯的优势在于对场景的理解及技术的实现,这主要得益于创始人团队及核心研发团队多年的围绕DPU真实使用场景的研发与产品经验。大禹智芯始终从场景出发,根据实际需求来补充和迭代DPU产品,在从场景到功能到软件到硬件,自上而下的传递过程中,把场景化需求抽象出来形成能够复用和固化的技术逻辑,逐渐固化到硬件中,并由此形成大禹智芯DPU的产品优势。
未来,大禹智芯将投身于东数西算建设队伍中,并与相关上下游企业和合作伙伴协同,提供高度适配用户和场景需求的DPU产品和服务,为东数西算国家工程“添砖加瓦”,贡献一份力量。
雷峰网(公众号:雷峰网)