雷锋网 AI 科技评论按:说起 FPGA,很多人可能都不熟悉,它的英文全称为 Field Programmable Gate Array,即现场可编程门阵列,也被称为可编程集成电路。随着大数据以及 AI 的发展,越来越多的数据中心引入 FPGA 作为 CPU 的加速器以提高数据处理速度,提升服务器性能,因此降低 FPGA 的能耗也成为数据中心里新的挑战。本文介绍了其中一种降低 FPGA 能耗的方法——基于自测量的 FPGA 动态电压调节解决方案。本文根据嘉宾的直播分享整理而成。
动态电压调节(DVS)作为常见的数字芯片节能技术,已经大量应用于 CPU 或 GPU 等芯片中。由于 FPGA 独特的可编程硬件结构,它们的片上电路随应用的改变而改变,这为 FPGA 的动态电压调节带来了极大的困难。来自多伦多大学电子系的在读博士生赵舒泽为此提出了一种新的改进方案,有效地降低了芯片能耗并提升了性能。
赵舒泽,浙江大学电气工程学院电力电子方向学士,多伦多大学电子系硕士,多伦多大学电子系博士在读。研究方向为 LED 光通信,谐振变流器,变流器的数字控制,以及电力电子在数据中心的应用。
分享提纲:
FPGA的简介,FPGA的片上结构
FPGA的能耗
基于自测量的FPGA动态电压调节(DVS)
分享内容:
大家好,我是赵舒泽,今天分享的内容是硬件方面我们的一些研究成果。接下来首先为大家简单介绍一下数据中心的结构以及能耗的问题,然后是关于 FPGA 的简介以及 FPGA 在能耗上的挑战。最后为大家介绍的是我们团队的研究成果,即如何在 FPGA 上实现动态电压的调节。
数据中心的能耗
近十几年,随着信息技术的发展,尤其是最近非常火的大数据、云计算、人工智能等这些方向的进展,数据中心作为这些实现这些应用背后的大脑,无疑也是经历了高速发展。随着数据中心的集成度,计算能力的提高,数据中心的能耗也一直是一个非常棘手的问题。
以美国为例,2013 年数据中心的总能耗估计是 91 太瓦时(TWh),相当于一个中等国家(例如菲律宾)全国的总用电量。要解决能耗问题,首先要看一下一个数据中心有哪些用电负载。
可以大致总结为四类:IT 负载,包括服务器,存储设备,网络设备,交换机等;电能传输与转化,包括变压器,电缆,电源,UPS,配电单元等带来的损耗;冷却系统,包括空调,水冷系统,风扇等。其他,包括照明,办公室用电等。
数据中心的结构
「ATS 自动转化开关」的目的是:在电网出现问题时,可以自动转换到柴油发电机组,这样可以保证负载端不会出现断电的情况。
「中心 UPS」有两方面的作用。一方面可以保证输送高质量的电能给IT负载,另一方面,在出现断电的情况下,柴油发电机还需要一定的启动时间,这段空档由 UPS 来暂时供电,保证负载不会出现断电的情况。
数据中心的能耗结构
每个数据中心的能耗其实很不同,这个图只是一个平均值。IT 负载其实只占到 36% 的能耗,电能传输与转化大概占 11%。其他有一半能耗都是被冷却系统用掉的。也就是说为了冷却 IT 负载和电能传输与转化所产生的热能,需要消耗等量甚至更多的能量来冷却数据中心,以保证正常工作。
如何降低IT负载中FPGA的能耗
FPGA 的中文名称为现场可编程逻辑门阵列。FPGA 在过去大量应用在消费电子产品,无线基站,军事,医疗等高端应用场合里,随着大数据,人工智能的快速发展,我们对服务器的响应速度的要求不断提高,CPU 已经被证明不太适合进行大量浮点运算,而 FPGA 的片上电路是可编程的,开发时间比较短,可以灵活的部署并且可以实现大规模的并行计算。由于这些原因,它开始被大量部署在数据中心里作为 CPU 的加速器,帮助数据处理以及计算,包括帮助网络通信等等。
FPGA的优势和劣势
对于 CPU/MCU 这样基于指令集的芯片来说,FPGA 有更大的灵活性,另外由于它是可编程的,可用最简单的硬件架构来实现所需要的逻辑功能,因此更节省能源。
缺点是,在和特种芯片 ASIC 相比,速度较慢,能耗更高。ASIC 芯片内部架构虽较为简单,不可以硬件编程,只能用来专门处理某一种功能,灵活性最差,但是在执行某一种任务上的效率最高。
FPGA 芯片内部架构稍微复杂一些,可以硬件编程,因而可以通过硬件编程语言来改变内部芯片的逻辑结构,从而能够在提供一定灵活性的同时,还能够保证较高的处理效率,算是在灵活性和性能上取了个折中。
FPGA的片上结构
FPGA的发展
数字IC的功耗
动态电压调节
FPGA的关键路径
每个应用都有独特的关键路径
FPGA的应用流程
FPGA的的动态电压调节
我们的思路是: FPGA 有不确定的片上结构,但是可以重复烧制。我们利用这个特点,把每一次的关键路径都提前提取出来,把这些关键路径单独烧制在 FPGA 上,先测量这些关键路径的延迟有多少,测完后把这些数据放在片外的存储器里。之后再将FPGA烧入用户的应用,动态电压调节的控制模块会从刚测到的数据中找到当前温度和频率下最低的供电电压是多少,然后电源按照这个电压来给 FPGA 来供电。
改进后的应用流程
完整的流程图解读请看视频回放。
实验装置
实验结论
雷锋网提供实验流程及具体细节推荐观看AI慕课学院:FPGA的动态电压调节(DVS)——谈谈数据中心里FPGA的节能。
微信公众号:「AI 研习社」长期提供免费视频直播课程,欢迎关注!
雷锋网