【学术干货】从「预测器」到「发现工具」:清华UniCM如何让AI真正理解全球气候系统
论文信息汇总
论文中文标题:学习全球气候模态的耦合动力学
论文英文标题:Learning the coupled dynamics of global climate modes
作者:清华大学电子工程系 李勇教授团队
期刊/会议:Nature Machine Intelligence
发表时间:2026年
DOI:10.1038/s42256-026-01245-5
全球气候系统是人类赖以生存的最复杂动态系统之一。在漫长的气候演变历程中,多种气候模态此消彼长、相互耦合,共同塑造着地球表面每一个角落的温度、降水与极端天气事件。当我们谈论气候预测时,厄尔尼诺-南方涛动(ENSO)往往是最受关注的话题——这一发生在赤道太平洋的海气耦合现象,能够通过复杂的遥相关机制影响全球气候,其预测价值不言而喻。
然而,全球气候系统绝非由单一气候现象所主宰。印度洋偶极子(IOD)、热带北大西洋模态(TNA)、北太平洋经向模态(NPMM)、南太平洋经向模态(SPMM)、印度洋 basin 模态(IOB)以及南印度洋偶极子(SIOD)等多个气候模态同时存在,它们通过跨洋盆遥相关和海气相互作用形成一个动态耦合的全球系统。一个区域的海温异常,可能在数月后引发另一个大陆的极端降水;一种气候模态的成熟衰退,往往与另一种模态的兴起存在隐秘关联。
长期以来,气候预测领域面临着一个根本性的方法论困境:大多数传统预测方法主要聚焦于单个气候模态的独立预测,或仅研究少数模态之间的简单线性关系。这种"各自为战"的研究范式难以刻画全球气候系统中广泛存在的非线性交互过程,更无法充分利用多模态耦合关系中蕴含的潜在可预报性信息。
近年来,人工智能在天气预报领域取得了令人瞩目的进展。以数值天气预报为基础的深度学习模型,已经能够在数天到数周尺度上实现高精度预测,部分任务甚至超越了传统数值模式的性能。然而,这些成功大多局限于短期天气预报范畴。当时间尺度延伸至季节、年际乃至更长的气候预测维度时,问题的本质发生了根本性变化:气候预测需要处理的是多个海洋和大气系统之间复杂的跨尺度相互作用,是对未来数月乃至数年内全球气候系统演化轨迹的预判。
这正是当前AI气候预测面临的核心挑战所在——如何让模型不仅"会预测",还能帮助科学家理解这些模态之间跨越时空的长期耦合关系,进而发现隐藏在复杂系统中的物理规律?这一挑战构成了AI for Science领域的重要前沿阵地。
研究动机
研究团队敏锐地洞察到了现有方法的局限性。当前主流气候预测模型通常将各个气候模态视为相互独立的研究对象,分别建立预测模型,然后简单地叠加或平均各模态的预测结果。这种方法存在几个根本性问题:
首先,物理一致性问题被忽视。 真实的气候系统中,各模态之间存在着明确的物理联系。例如,NPMM的变化往往领先ENSO约4个月,这种滞后相关关系反映的是跨洋盆的海气耦合过程。如果模型分别预测各模态而忽视这种耦合,就可能产生物理上相互矛盾的结果。
其次,耦合可预报性未能被有效利用。 气候系统的可预测性不仅来自单个气候现象本身,更来自多个气候模态之间长期存在的耦合关系。这种"涌现可预报性"(Emergent Predictability)是传统独立预测方法难以触及的宝贵信息资源。
第三,可解释性严重不足。 当前大多数深度学习气候预测模型采用"黑箱"设计,虽然能够给出预测结果,但难以解释模型为何做出这样的预测。这种不可解释性严重限制了模型在科学发现中的应用价值——科学家不仅需要预测结果,更需要理解气候系统的运行机制。
正是基于以上洞察,清华大学电子工程系李勇教授团队提出了一个根本性的科学问题:能否设计一个统一的建模框架,将全球海洋-大气系统视为一个相互作用的整体,同时学习多个气候模态的演化规律和它们之间的耦合动力学?
这个问题的重要性远超技术层面本身。如果能够实现真正的多模态统一建模,不仅有望显著提升气候预测的准确性和时效性,更能够为AI辅助科学发现开辟全新路径——让AI从单纯的"预测器"转变为能够揭示物理机制、提出科学假设的"发现工具"。
核心创新
UniCM(Unified Climate Model,统一气候模型)的提出标志着气候预测领域的一次范式突破。其核心创新可以从以下几个维度深入理解:
从「单一模态」到「全局耦合」的方法论转变
传统气候预测遵循"分解-独立预测-结果叠加"的技术路线,各模态被切割成独立的预测对象。UniCM则首次提出从全球耦合系统的视角出发,将整个气候系统建模为一个大尺度相互作用的复杂网络。这一转变的理论基础在于:气候模态之间并非孤立存在,而是在物理上通过海洋-大气耦合过程紧密联系。建模这种耦合关系,能够释放出传统方法无法利用的预测信息。
双分支架构设计
UniCM采用精心设计的双分支架构,分别负责不同层次的气候信息处理:
Globalformer模块:专注于学习局地物理场的时空演化,处理海表温度(SST)、风应力、温跃层深度、上层海洋温度等关键物理变量。这一分支负责捕捉气候系统的细粒度动态特征。
Modeformer模块:聚焦于气候模态之间的关系学习,直接处理ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD等七类重要气候模态的时序演化,学习它们之间的非线性交互和共同演化规律。
双向耦合机制:Mode-to-Patch Guidance
最具创新性的设计是UniCM建立的双向耦合机制。一方面,局地物理场的变化产生并塑造大尺度气候模态;另一方面,已经形成的气候模态又反过来影响局地物理场的未来演化。这种双向耦合机制实现了从局部到整体、再从整体反馈局部的闭环建模,使模型能够更好地捕捉气候系统的涌现特性。
可解释性与科学发现能力的融合
UniCM不仅追求预测精度,更强调模型的可解释性。通过分析模型内部的注意力机制,研究团队发现模型能够自动聚焦于具有物理意义的关键区域和关键模态关系。这意味着UniCM不仅仅是一个预测工具,更是一个能够帮助科学家发现潜在机制、提出新科学假设的智能助手。
技术方案详解
整体架构设计
UniCM采用Transformer架构作为基础骨架,针对气候预测任务进行了系统性优化。整体架构包含三个核心组件:
1. 输入编码层
模型接收两类输入:局地物理场数据和气候模态指数数据。
物理场数据包括:全球海表温度(SST)场、海洋上层温度剖面、风应力矢量场、温跃层深度等。这些数据首先经过卷积神经网络编码为patch序列,每个patch对应地球表面的一个空间区域。
气候模态数据则直接编码为模态特征向量,包含ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD等七类模态的时序信息。
2. Globalformer模块
Globalformer负责处理patch化的物理场数据,采用标准Transformer架构进行时空建模。其核心机制包括:
空间自注意力机制:学习不同空间区域之间的远程依赖关系,捕捉如厄尔尼诺期间赤道太平洋与印度洋之间的遥相关现象。
时间自注意力机制:建模气候变量在时间维度上的演化规律,捕捉季节性和年际变率。
物理约束层:在注意力计算中引入物理先验知识,如赤道波动理论、海气耦合约束等,确保模型输出符合基本物理规律。
3. Modeformer模块
Modeformer是UniCM的核心创新模块,专门设计用于学习气候模态之间的耦合关系:
模态间注意力机制:计算不同气候模态之间的注意力权重,识别关键耦合关系。例如,模型可以自动学习到NPMM与ENSO之间的强耦合关系。
滞后交互建模:采用因果注意力机制建模模态之间的滞后相关,支持跨时间尺度的信息传递。
模态融合层:将多模态信息整合为统一的气候状态表征,同时保留各模态的特异性信息。
4. 双向耦合层:Mode-to-Patch Guidance
这是UniCM最具特色的技术组件,实现Globalformer与Modeformer之间的双向信息流动:
Bottom-up路径:Globalformer提取的局地物理特征向上汇聚,形成大尺度气候模态表征。这一过程模拟了局地海气相互作用汇聚形成全球气候模态的物理过程。
Top-down路径:Modeformer生成的气候模态状态向下广播,指导Globalformer对关键区域和关键物理过程的关注。这一机制被称为"mode-to-patch guidance",体现了大尺度气候背景对局地天气气候的调制作用。
通过双向耦合,模型形成了一个闭环的全局-局部信息交互系统,能够更准确地捕捉气候系统的复杂动态。
训练策略
UniCM采用多任务联合训练策略,同时优化以下目标:
预测精度损失:最小化预测气候场与观测场之间的均方误差。
模态重建损失:确保模型能够准确重建各气候模态的时间序列。
耦合保持损失:强制模型保持气候模态之间已知的物理耦合关系,如NPMM领先ENSO约4个月的关系。
这种多目标训练策略确保模型在追求高预测精度的同时,保持对物理规律的遵循。
预测推理
在推理阶段,UniCM支持多步滚动预测:
- 输入当前时刻的物理场和模态数据
- 通过Globalformer和Modeformer进行状态更新
- 通过mode-to-patch guidance机制实现全局-局部的信息交互
- 输出下一时刻的预测结果
- 将预测结果作为输入,循环进行多步预测
这种自回归预测机制使UniCM能够实现长达24个月的气候预测。
实验结果分析
ENSO预测能力达到国际领先水平
ENSO预测是长期气候预测领域最具挑战性的任务,也是检验模型能力的黄金标准。在1980—2023年的长期历史数据检验中,UniCM展现出卓越的预测性能:
预测时效大幅延长:UniCM在24个月预测窗口内持续优于多种代表性基线模型,包括当前最先进的物理统计模型和深度学习模型。模型成功将ENSO的有效预测提前期延长至19个月,而此前先进模型通常只能达到15至16个月左右。这一提升在气候预测领域具有里程碑意义。
突破春季可预报性障碍:春季可预报性障碍(Spring Predictability Barrier)是困扰气候预测界数十年的难题——由于春季大气状态转换导致预测信号减弱,模型在跨越北半球春季时预测技巧往往急剧下降。UniCM通过学习多模态耦合关系,有效克服了这一困难,在跨越春季时仍能保持较高预测技巧,将有效预测能力延长至约14个月。
极端事件精准复现:模型成功再现了多个历史极端ENSO事件,包括1997—1998年超级厄尔尼诺事件以及2020—2023年连续三年的"三重拉尼娜"事件。这些事件在气候历史上具有重要地位,其准确预测对于防灾减灾具有重大价值。UniCM不仅准确捕捉了这些事件的发生时间,还成功复现了它们的发展过程和衰减轨迹。
首次实现全球多气候模态统一预测
UniCM的突破性不仅体现在ENSO预测上,更在于其首次实现了真正意义上的全球多气候模态统一预测。在同一框架下,模型能够同时预测七类重要气候模态:
气候模态 | 有效预测提前期 | 相对提升 |
|---|---|---|
ENSO | 19个月 | +20% |
IOD | 7个月 | +22% |
IOB | 6个月 | +18% |
SIOD | 5个月 | +25% |
SPMM | 8个月 | +15% |
NPMM | 9个月 | +20% |
TNA | 6个月 | +22% |
结果显示,模型在多个非ENSO模态上的预测能力均显著优于现有代表性方法。特别值得注意的是,部分较难预测的非ENSO模态平均预测技巧提升超过22%,这表明UniCM的耦合建模策略对于各类气候模态都具有普遍有效性。 |
耦合关系准确重建:更重要的是,UniCM能够准确重建不同气候模态之间真实存在的滞后相关关系。例如,模型成功再现了NPMM领先ENSO约4个月的物理联系,以及多个跨洋盆气候模态之间的耦合结构。这种能力证明模型学到的并非简单的统计相关性,而是真实存在于全球气候系统中的物理耦合机制。
从预测到科学发现的能力验证
研究团队通过分析模型内部注意力机制,发现了UniCM在科学发现方面的巨大潜力:
自动识别关键预测因子:在重大ENSO事件发生之前,模型的注意力机制会自动聚焦于具有物理意义的关键区域和关键模态关系。例如,在1997年超级厄尔尼诺事件发生前,模型识别出NPMM的重要先导作用,这一发现与后续气候物理研究结果高度一致。
发现关键枢纽模态:在部分复杂气候事件的分析中,模型发现TNA可能扮演关键枢纽角色,通过跨洋盆遥相关影响多个气候模态的演化。这一发现为理解气候系统的内在关联提供了新视角。
这些结果表明,UniCM不仅是一个高精度的预测工具,更是一个具有科学发现能力的智能助手,有望成为气候科学研究的重要辅助工具。
优势与不足
主要优势
1. 方法论范式创新
UniCM突破了传统气候预测"单一模态、分别预测"的思路,首次从全球耦合系统的视角统一建模多个海洋-大气气候模态之间的复杂动力学关系。这一范式创新为整个气候预测领域提供了新的研究思路和技术路线。
2. 预测性能显著提升
通过充分利用模态间耦合关系,UniCM在ENSO等关键气候模态的预测上实现了显著突破,有效预测提前期延长3-4个月,这一进步在气候预测领域具有重要应用价值。
3. 可解释性强
相比传统深度学习"黑箱"模型,UniCM通过注意力机制的可视化分析,能够揭示模型关注的物理关键区域和模态关系,为理解模型预测逻辑提供了窗口,也为科学发现提供了可能。
4. 应用前景广阔
从农业生产到水资源管理,从能源调度到防灾减灾,UniCM更准确、更长时效的气候预测能力将在众多领域产生实际应用价值。其揭示的耦合机制也可能为气候干预研究提供理论支撑。
潜在不足
1. 数据依赖性
作为数据驱动方法,UniCM的性能高度依赖历史观测数据的质量和长度。对于观测稀疏的区域(如南大洋、高原等),模型预测能力可能受限。长时间序列高质量数据的获取仍是挑战。
2. 极端事件样本稀缺
极端气候事件(如超级厄尔尼诺)的历史样本极为有限,这使得模型在极端事件预测上面临样本不足的困难。虽然模型在历史极端事件复现上表现良好,但未来极端事件的预测能力仍需验证。
3. 物理机制的可解释性边界
虽然UniCM展现出一定的科学发现能力,但模型学习到的耦合关系是否真正对应物理因果,还是仅是统计相关,仍需进一步的因果推断验证。如何将数据驱动的发现与传统物理理解有机结合,仍是开放问题。
4. 计算成本
相比传统统计预测方法,UniCM的训练和推理需要更高的计算资源支持,这可能限制其在资源受限场景中的应用。
未来研究方向
技术层面深化
因果推断与耦合建模的融合:当前UniCM主要学习统计相关性,未来可引入因果推断方法,更精确地识别气候模态之间的因果关系,从"关联学习"升级为"因果发现"。
多尺度耦合建模:现有模型主要关注季节-年际尺度,未来可扩展到季节内振荡(如MJO)、年代际气候变化乃至更长尺度,建立跨时间尺度的统一耦合框架。
观测-模式混合建模:将数据驱动方法与物理数值模式结合,利用模式输出的物理一致性约束和观测数据的真实性,实现优势互补。
应用领域拓展
气候影响预测深化:将气候模态预测与具体气候影响(如降水、温度、台风路径)相结合,提升气候影响预测的直接应用价值。
气候变化情景预测:在全球变暖背景下,气候模态的统计特性可能发生变化。UniCM框架有望扩展到气候变化情景下的气候模态演化研究。
跨学科应用探索:UniCM所体现的"局部过程-整体结构"双向耦合建模思想,可推广到其他复杂系统研究,如生态系统、社会经济系统等。
科学发现功能增强
知识图谱构建:基于UniCM学习到的耦合关系,构建气候系统知识图谱,系统化表示和推理气候模态间的复杂关系。
假设自动生成:开发基于UniCM的假设生成系统,自动从模型行为中发现新的气候机制假说,加速科学发现进程。
人机协作研究范式:探索科学家与AI模型协作研究的新范式,AI负责模式识别和假设生成,科学家负责物理验证和理论构建,形成高效的闭环研究系统。
编辑点评
清华团队提出的UniCM模型在气候预测领域具有划时代意义。这项工作不仅实现了技术层面的性能突破——将ENSO有效预测提前期延长至19个月,更为重要的是,它开启了一种全新的气候研究范式:不再将AI视为单纯的预测工具,而是作为探索复杂系统规律的智能助手。
从方法论角度看,UniCM的双分支架构和双向耦合机制为处理复杂系统中的多尺度、多模态耦合问题提供了可借鉴的技术框架。这种"全局-局部双向耦合"的设计思想具有广泛的通用性,有望推广到生态系统、流行病传播、社会经济系统等其他复杂系统研究中。
从科学价值角度看,UniCM展现出的可解释性和科学发现能力最为引人注目。模型能够自动识别物理关键区域、发现模态间的隐藏关系,这意味着AI不仅能"做事",还能"说话"——解释它看到了什么、发现了什么。这种能力的释放,将极大加速人类对气候系统的认知进程。
当然,作为一项新兴技术,UniCM仍有提升空间。如何从统计关联提升到因果发现、如何处理气候变化背景下的非平稳性、如何在有限样本下提升极端事件预测能力,这些都是值得深入探索的方向。
最后需要指出的是,气候预测是一个高度交叉的领域,需要气象学、海洋学、计算机科学、数学等多学科的深度协作。期待更多研究者加入这一方向,共同推动AI赋能气候科学的新发展。
本文内容由洵锋学术编辑整理,学术信息仅供参考,详情请参阅原始论文。
