“一只蝴蝶在巴西微微振翅,是否会掀起美国德克萨斯州的龙卷风?”
1963年,气象学家爱德华劳伦兹发现混沌理论后,发出如此惊世一问。这也就是我们常说的蝴蝶效应。劳伦兹用它来形容“厄尔尼诺”等复杂气候现象的难以预测性。简单理解就是:复杂系统中,任何微小的不确定性都会被放大,并导致最终的预测结果与瞎猜无异。
厄尔尼诺的出现将引发洪涝、干旱、高温、暴雪等自然灾害,我们熟知的98洪灾、08雪灾、澳大利亚丛林大火、美国龙卷风…..都与此相关。数十年来,专家们一直在尝试各种方法解决厄尔尼诺的预测问题,但效果都不甚理想。
不过,令人惊喜的是,在刚刚结束的这场比赛中,一支黑马团队刷新了行业内预测精度的最高纪录!
4月22日,阿里达摩院联合南京信息工程大学、国家气候中心、国家海洋环境预报中心、阿里云天池平台等机构共同举办的AI气候预测大赛迎来了终极决赛。赛场上,来自西安交通大学的的swg-lhl团队夺得了本次大赛的冠军,他们研发的AI算法模型在关键指标上达到了44.43分。该成绩超过了2019年发表于《Nature》的最佳成果。
此外,参赛团队的AI算法还预测,未来2年大概率不会出现厄尔尼诺和拉尼娜现象(NINO 3.4指数波动小),换言之,今年全国可能迎来暖冬,夏季长江流域出现洪涝灾害的几率较低。
根据比赛规则,Top 5 团队将瓜分阿里20万元奖金。
本届大赛自启动以来,共有2849支团队报名参赛,400多支队伍提交结果,200多支队伍有成绩。经过晋级赛选拔,最终6支团队进入决赛阶段。今日终极决赛在南京信息工程大学顺利结束,各支队伍成绩如下:
第一名:swg-lgl团队(桑维光、曾海如、罗海伦)
第二名:吴先生的队伍(潘翔、吴嘉铖、高磊)
第三名:ailab团队(王天雷、胡中岩、耿良超)
据了解,以上团队的AI算法模型超越了《Nature》论文模型的39.2分,这意味着这些算法能够取得比原模型周期更长、精准度更高的厄尔尼诺预测结果。
2019年9月,罗京佳教授与韩国全南国立大学研究团队共同发表一项研究成果,这篇论文名为“Deep learning for multi-year ENSO forecasts”,发表后同时登上了《Nature》的《Science》杂志。当时,这项研究论文被视为深度学习在气象预测领域的开山之作。
论文地址:https://www.nature.com/articles/s41586-019-1559-7
论文中,他们利用卷积神经网络(CNN)首次将厄尔尼诺现象的预测准精度提高到了80%,且预测时效为18月。在此之前,相同预测时效下,国家气象局及相关研究机构的准确度均不超过75%。
据阿里达摩院官方透露,本次比赛共有来自全球13支队伍的AI算法结果超过了《Nature》文章的水平,而且部分团队的成果将在国家气候中心等机构应用。
这些团队为何能够取得如此成绩?是得益于数据优势,还是算法创新?AI科技评论了解到,参赛队伍通过预测Nino3.4区海域的海水温度,来进一步预测异常气象,所用数据集为全球海洋环境监测数据和厄尔尼诺现象观测数据,这些与罗京佳教授在论文中的研究条件并无较大差异。
对此,罗京佳教授对AI科技评论表示,他发表在《Nature》上的论文所使用的卷积神经网络是一个相对成熟的算法,而非最先进的算法。近几年,越来越多高性能的深度学习算法被提出,这些将有助于提高预测精度。
同时,他还表示,未来随着人工智能在数据、算法方面不断精进,AI在气象预测领域的应用还有更大的想象空间。
本次赛题是一个时间序列预测问题。基于历史气候观测和模式模拟数据,利用T时刻过去12个月(包含T时刻)的时空序列(气象因子),构建预测ENSO的深度学习模型,预测未来1-24个月的Nino3.4指数,如下图所示:
根据赛题信息,各参赛队伍在现有先进模型的基础上进行了不同程度的创新,如冠军团队swg-lhl,他们采用了一种全新的TCNN模型提取时空特征信息,降低参数量并有效防止过拟合,实验证明,该模型在不同数据集表现稳定,鲁棒性更强。
下面AI科技评论将Top3团队所使用的模型结构和特点一一呈现。
第一名:swg-lgl团队
他们使用1维卷积提取时间维度特征,使用2维卷积提取空间特征。时间维度特征和空间维度特征是分离串行提取,可以降低参数量,防止过拟合。为了感受不同时间维度尺度信息,他们使用3种尺度图去提取时间特征,然后融合。模型图如下:
图注:整体框架
图注:CNN特征提取
第二名:吴先生的队伍
他们在SA-ConvLSTM 和ConvLSTM的基础上增加了Self-attention memory module,即一个对空间维度采取注意力机制的模块,和一个可记忆非局部时空特征的memory unit M。通过传统的ConvLSTM计算得到的H会再通过Self-attention memory module得到最终SA-ConvLSTM的输出和下一个时刻的M。
图注:自我注意力记忆模块
图注:自我注意力 ConvLSTM (SA-ConvLSTM) 模块.
该模型充分发现了自注意力机制在较长时间尺度的气候演变时空预报中的作用。
创新之处在于,考虑了空间非局部的、时间更连续的时空结构演变特征,整个西太平洋海温时空结构演变的信息,用时空预报作为时间序列预报的进一步扩充,并利用自注意力机制充分提取时空结构信息来做预报。
第三名:ailab团队
LSTM模型使用了一种门控结构用以控信息的流动,避免RNN长时间传递梯度消失问题。LSTM一共有3个门,分别是输入门、遗忘门、输出门。遗忘门控制丢弃多少上一时刻的细胞状态。输入门控制多少新的信息会进入到当前细胞状态。最后,输出门决定细胞状态的哪些部分需要输出。他们使用ConvLSTM作为基础模型。ConvLSTM将LSTM中的全连接操作替换为卷积操作,使得数据的空间特征成功融入了网络,同时大大减少了网络的参数数目。
在该模型中,基本单元Causal LSTM使用的是级联结构,将状态C的结果用于状态M的计算。在第一层和第二层之间插入了类似GRU结构的高速梯度单元GHU,用于缓解状态M在长时间预测过程中的特征丢失问题。
创新之处在于:
1. 将有监督回归任务转化为无监督时空预测问题,从而提升了对数据的利用率以及深度学习算法的可解释性。
2. 使用更先进模型,通过复现近5年在发表各顶会中的论文模型,团队挑选了相对稳定、高性价比的模型,并对此进行了改进使之更适合此次比赛。
如果能够提前预测厄尔尼诺现象,其价值不言而喻。
厄尔尼诺,主要指热带太平洋东部和中部海水温度异常增暖的现象,通过海洋与大气之间的相互作用,使整个世界的气候模式发生变化。如引发洪涝、干旱、高温、雪灾等极端事件。
图注:印度出现大面积干旱(图源:trulybelong.com)
厄尔尼诺-南方涛动(ENSO)现象是地球上最强、最显著的年际气候信号,前者体现在海洋方面的变化,后者发生在大气层面,它是一种发生在东南太平洋与印度洋及印尼地区之间的反相气压振动现象。
有专家称,随着全球变暖趋势加强,ENSO已由“罕见”变成了“普遍”现象。提前预测ENSO,做好防灾减灾工作意义重大。
2017年,罗京佳教授将深度学习算法引起气候预测领域,使得相关研究才有了突破性进展。
我们知道,继首战韩国职业棋手李世石后,由DeepMind公司研发的智能体AlphGO,在2017年的围棋赛中再次以3:0战绩击败了世界冠军选手柯洁。这一年,以AlphGo为代表的深度学习网络名声大噪,以深度学习为主题的第三次人工智能浪潮也开始袭来。
当时,罗京佳教授时任南京信息工程大学气候与应用前沿研究院(ICAR)担任院长,在该领域已深耕20余年,主要研发气候动力学以及气候模式开发、预测及其应用、海洋动力学。面对这股浪潮,他敏锐地察觉到深度学习或许将为气候预测带来新的可能性。
他说,“AlphGo战胜人类展现了其强大的学习和信息处理能力。类似于围棋游戏,在气候预测中,大气、海洋、温度等众多影响因子之间的相互作用也非常复杂,基于深度学习方法的AI或许能够自学出一种更好的统计模型。”
两年后,罗京佳教授及团队将相关研究成果发表在了《Nature》杂志,如上文所述,他们预测1.5年厄尔尼诺现象的准确度达到了80%。虽然这一成绩还远未达到精准预测的程度,但它刷新了当时行业预测的最高水平,并证明了深度学习方法在气候预测中应用的可能性。
此外,论文中显示,卷积神经网络还能预测海表温度异常的不同空间分布,弥补了目前动力预测系统的不足。
“AI预测ENSO,也不可避免地会遇到小样本数据和可解释性的问题”,在谈到AI在气候预测方面的研究现状时,罗京佳教授说道。
相比于天气预测,气候预测的周期性更长(厄尔尼诺每2-7年发生一次),它所能够利用的数据也就更少。目前相关研究所使用的数据集大多为1871年-1973年全球海洋天气和环境的测量数据,以及1961-2017年厄尔尼诺现象的观测数据。
细算下来,相关数据量不足150年,如果把每年的相同月份进行对比,每个月的样本数量少于150个。对于深度学习的样本数量而言,这显然是不足的。值得一提的是,在这方面,罗京佳提出了利用迁移学习模拟数据的方法,在一定程度上解决了有限数据样本的问题。
当然,大数据本身并不意味着大价值,有效的数据分析还需要依靠机器学习算法,尤其是深度学习算法。因此,更先进的算法能够进一步提升AI预测结果的准确性,如本次大赛的结果就是最好的体现。
长期以来,AI被认为是个黑匣子,虽然能输出结果,但人们并不清楚它是如何得出这一结果的,这也就是AI的可解释性问题。罗京佳教授认为,AI的可解释性差有两点原因,一是它不像传统的统计学习方法,能够遵循固定的程序和规则,了解每因子所做的贡献。二是人工智能模型越来越复杂,一个模型可能有上亿个参数。
他强调,在地理研究中,我们更关注实现过程的机制和原理问题,由于AI的可解释性差,在一定程度上限制了其在气候预测领域的应用和发展。
不过,可解释性问题已经成为行业内的一个热点课题,专家们提出了很多方法尝试解决它,比如在数据训练和网络框架中,引入机理约束和物理约束,这些都是目前在尝试的一些解决思路,罗京佳教授说道。
本次赛事由阿里巴巴达摩院,联合南京信息工程大学、国家气候中心、国家海洋环境预报中心以及安徽省气象局共同举办。
今日赛场上,该领域内的多为重磅级专家,包括国家最高科学技术奖获得者、中科院院士曾庆存、国家气候中心副主任贾小龙,中国科学院院士王会军、戴永久、南京信息工程大学教授罗京佳等均有出席或担任评委。
曾庆存院士表示,人工智能与大气科学的结合大有可为,希望未来研究人员能把大气科学已有的知识和方法更好地与人工智能结合,要敢于为世人、为世界之先,创造出最好的人工智能。
海洋环境预报中心副主任凌铁军表示:“在海洋预报与预测领域,仍然有很多科学与理论问题尚未完全解决,数学表达还很不完善,在技术实现和效果上仍存在较大不确定性,AI正是解决这些问题的重要手段。”
对于本次赛事的初衷和目标,阿里达摩院曾表示,国际气象行业主要应用机器学习动力模式进行气候预测,但多年来,其预测范围只能局限于100公里以上的区域,无法实现精细化的预测。达摩院的目的就是探索用AI来更高效更精细地预测影响气候的厄尔尼诺现象,并将预测周期延长至2年。
本次大赛于今年2月3日正式启动,共有2849个队伍报名,3000余选手参赛,参赛选手覆盖300所中国高校,91所海外高校,96家企业,其覆盖范围之大,影响之广在业内少有,更重要的是,比赛最终取得了突破性的成果。
据介绍,本次大赛涌现的AI新算法,将用于国家气候中心、国家海洋环境预报中心等业务机构,为未来极端天气提供预警信息。此外,知名气候研究学术组织CLIVAR还将设立专刊,邀请Top 6参赛团队、科研机构、知名专家在AI在气候预测领域进行投稿。CLIVAR在该领域有“气候科学奥林匹克盛会”之称。
对于本次大赛所取得的突出成果,世界气象组织(WMO)秘书长佩蒂瑞·塔拉斯还发来祝贺,他表示,人工智能在气象领域发挥越来越重要的作用,是地球预警系统和多灾害预警服务的基本方法;人工智能创新及应用是世界气象组织及成员实现可持续发展目标、解决未来科学问题的最重要领域之一。
雷锋网雷锋网雷锋网