11月14日,新一期全球超级计算机500强(TOP500)榜单在美国盐湖城公布,中国神威太湖之光蝉联冠军,由国防科大研制的“天河2号”屈居亚军。
11月17日,在美国盐湖城召开的全球超级计算大会(SC2016)上,由中科院软件所杨超和清华大学计算机系薛巍、地球系统科学研究中心付昊桓等共同领导的团队所完成,运行于神威太湖之光的应用 “千万核可扩展大气动力学全隐式模拟”获得戈登贝尔奖,实现了该奖创办30年来我国在此大奖上零的突破,打破了西方国家对该奖项的垄断。
(获戈登贝尔奖)
为何说神威太湖之光是世界第一?
神威太湖之光之所以荣获TOP500排行榜冠军,原因在于其Linpack成绩无与伦比。
Linpack指的是矩阵求解,在科学计算中把实际问题抽象成方程组,然后离散成矩阵计算矩阵倍,代表的是传统的以矩阵为基础的数值计算方法,常用于理科和工科的数值求解和数值模拟。那么为何超算大多以Linpack测试成绩论高低呢?
原因就在于很多科学计算模型都包含了矩阵求解,比如解微分方程,因此在超算任务中具有不可取代性——像辐射流体力学就是求解微分方程,而核爆炸模拟其实就是辐射流体力学+蒙特卡洛预测,雷达截面的矩量法计算也有赖于解微分方程,业内专家还告诉笔者“现在的深度学习算法的核心算法与Linpack的是一个”.......
因此,Linpack测试并非是一些跑分软件那样:不服跑个分,而是真正具有实战价值的测试。
Linpack效率指的是实际计算时的次数除以理论计算,举例来说,神威太湖之光的理论性能为125.4 PFlops,Linpack浮点性能93PFlops,Linpack效率为74.16%。那么,神威太湖之光Linpack测试成绩到底如何呢?我们做一个对比:
TOP500排行第一,中国,神威太湖之光,理论性能125.4PFlops,Linpack双精浮点性能为93PFlops,Linpack效率74.16%;
TOP500排行第二,中国,天河2号,理论性能54.9Pflops,Linpack双精浮点性能33.8PFlops, Linpack效率61.5%;
TOP500排行第三,美国,泰坦,理论性能27 Pflops,Linpack双精浮点性能17.6 PFlops,Linpack效率为65.19%。
这里要说明一点,就是超算的规模越大,Linpack测试效率的提高就越难——规模大到如一定程度,维持一段时间的稳定运行是非常难的,何况是太湖神威之光93PFlops的高性能。而神威太湖之光在Linpack测试性能是美国超算泰坦5倍以上的情况下,Linpack测试效率大幅领先于泰坦,这就非常可贵了!
神威太湖之光用不起来?
由于采用异构计算的原因,会导致在编程上比较麻烦,不像日本京那样的同构超算在编程上方便——由于异构编程需要提前预知模型并做特殊优化,而且很多应用未必适合异构模型,使得采用异构计算的超算对于编程和优化的要求更高,进而使一些媒体认为神威太湖之光只能用来跑分刷TOP500排行榜,是用来做政绩工程的大花瓶。但实际情况恐怕并非如此。关于这一点,3个应用入围戈登贝尔奖,一个应用荣获戈登贝尔奖就是最好的回击。
戈登贝尔奖是由美国计算机协会颁发的奖项,奖金1万美元,由高性能计算的先驱GordonBell提供,旨在奖励在高性能计算应用方面取得杰出成就。与TOP 500、TOP100着眼于超算Linpack成绩不同,戈登贝尔奖更着重于高性能计算的计算应用。
在天河2号和神威太湖之光连续多年霸占TOP500榜首的情况下,在性能上冠绝全球已经不再是中国工程师们瞄准的第一目标,有了高性能的超算如何将超算充分用起来才是迫切要实现的目标,而且在超算应用领域,中国和西方还是有一定差距的——工程仿真领域以商业软件多,而且这当中大多是国外软件,这些国外软件不仅价格特别昂贵,而且并行规模受限,有些模块国外是禁运的,有些可以用于军工的软件也严禁出售给中国。也正是在应用上存在一定差距,在过去几十年里,戈登贝尔奖一直被西方国家垄断。而本次荣获戈登贝尔奖,对中国高性能计算而言则是里程碑性的成绩。
“千万核可扩展大气动力学全隐式模拟”是一种新的用于大气动力模拟的高可扩展全隐式求解算法和软件,第一次在有效时间尺度完成了网格分辨率小于500米的大气模拟。网格分辨率小于500米是什么水平呢?日本的天气预报、灾害预报很准,原因就在于日本的模式水平分辨率最高已经达到了870米,在“千万核可扩展大气动力学全隐式模拟”问世前,这是非常高的水平。而国内科研团队在使用神威太湖之光后,可以将网格分辨率做到比日本最高水平还要精确仅一半。
在技术上,“千万核可扩展大气动力学全隐式模拟”也实现了应用与算法两个层面实现了重大突破:
在应用层面,第一次证明了全隐式求解方法是构建未来超高分辨率大气模式一种有竞争力的选择,该大气动力过程的模拟速度较美国下一代大气模拟系统(GFDL开发的AM3非静力大气模式)的计算效率提升近1个数量级,未来可应用于高分辨率气候模拟和高精细数值天气预报,提升预估、预报精度。
在算法层面,实现了目前世界上第一个可扩展到千万核、峰值效率超过6%的隐式求解器,较2015年戈登贝尔奖获奖工作在并行度和峰值效率均提升一个数量级,未来在航空、地学、能源等领域的挑战性计算问题中有着广阔的应用前景。
(“千万核可扩展全球大气动力学全隐式模拟”核心算法)
此外,“千万核可扩展全球大气动力学全隐式模拟”能应对可能性低但破坏性大的极端天气,全面提高我国应对极端气象事件和自然灾害的减灾防灾能力,尽可能保护人民财产安全免受突发性极端恶劣天气的损害。