混合精度算术:在他被 2006 年SC会议接收的论文“Exploiting the Performance of 32 bit Floating Point Arithmetic in Obtaining 64 bit Accuracy”中,Dongarra 率先利用浮点算术的多种精度来更快地提供准确的解决方案。最近的 HPL-AI 基准(该基准在世界顶级超级计算机上实现了前所未有的性能水平)测试展示,这项工作在机器学习应用中发挥了重要作用,该基准在世界顶级超级计算机上实现了前所未有的性能水平。
批量计算:Dongarra 开创了将大型密集矩阵的计算划分为可独立和并行计算的范式,常被用于模拟、建模和数据分析。根据他在 2016 年的论文“Performance, design, and autotuning of batched GEMM for GPUs”,Dongarra 领导了用于此类计算的「批量 BLAS 标准」的开发,并应用于软件库 MAGMA 和 SLATE 中。
Dongarra 在上述工作中与许多国际学者进行合作,通过不断开发新技术以最大限度地提高性能和便携性,同时使用最先进的技术保持数值可靠的结果,始终扮演了创新驱动力的角色。他领导的其他研究还包括消息传递接口 (MPI),MPI 是并行计算架构中可移植消息传递的事实标准;以及性能 API (PAPI),它提供了一个接口,允许从异构系统收集和合成来自组件的性能。他帮助创建的标准(例如 MPI、LINPACK 基准测试和 Top500 超级计算机列表)支撑着从天气预报到气候变化再到分析大型物理实验数据的计算任务。参考链接:https://amturing.acm.org