当前位置：首页 > news >正文

机器学习海气耦合模型Ola：解耦训练与滞后集合预报实战

news 2026/7/13 1:39:10

1. 项目概述：当机器学习遇见海气耦合

在气候预测这个领域里摸爬滚打了十几年，我见过太多复杂的物理模型和让人头大的耦合方案。传统的海气耦合模型，比如那些基于物理方程组的数值模式，虽然机理清晰，但计算成本高得吓人，一次季节预测动辄需要消耗海量的超算资源，调试和优化更是周期漫长。最近几年，情况开始发生变化。以GraphCast、FourCastNet等为代表的数据驱动模型，在中期天气预报上展现出了惊人的效率和一定的技能，这让我们这些搞气候预测的也坐不住了：机器学习（ML）这套方法，能不能用来啃下海气耦合和长期预测这块硬骨头？

这个问题的答案，就是我今天想和大家深入聊聊的“Ola”模型。它不是一个空想的概念，而是一个实实在在的、将机器学习模型用于海气耦合并进行滞后集合预报（Lagged Ensemble Forecasting, LEF）的工程实践。简单来说，它的核心目标就是用两个分别训练好的神经网络——一个模拟大气，一个模拟海洋——让它们像真实的物理系统一样“对话”和相互驱动，从而实现对未来数月气候状态的预测。这听起来有点像用AI“数字孪生”来模拟地球的气候系统。

为什么这件事如此重要？因为像厄尔尼诺-南方涛动（ENSO）这样的气候现象，其本质就是海气相互作用的产物。热带太平洋的海表温度（SST）异常，会通过加热大气改变风场和降水；而改变后的风场（特别是信风）又会反过来通过“风应力”驱动海洋，改变洋流和温跃层深度，进一步影响SST。这个反馈循环是ENSO的生命线。传统模型要精确模拟这个过程，需要求解极其复杂的流体动力学和热力学方程。而机器学习模型则尝试从历史观测数据（再分析资料）中直接学习这种耦合的“映射关系”，希望用更简洁的数学表达来逼近物理规律，从而大幅提升预测效率。

关键词：海气耦合、机器学习、集合预报、滞后集合预报、ENSO、气候预测、S2S预报。这几个词串起了整个项目的技术脉络。本文将围绕Ola模型的具体实现，拆解其耦合框架的设计思路、机器学习模型的构建与训练要点、滞后集合预报的实施细节，并分享在实际操作中可能遇到的坑与解决技巧。无论你是刚接触气候预测的同行，还是对AI在科学计算应用感兴趣的工程师，相信都能从中获得一些直接的参考。

2. 核心思路：解耦训练，耦合推理

Ola模型最核心的设计哲学，也是它区别于传统“端到端”训练一个巨型耦合模型的关键，在于“解耦训练，耦合推理”。这八个字背后，是工程上对可行性和效率的深刻考量。

2.1 为何选择分而治之？

在项目初期，我们面临一个根本性选择：是构建一个庞大的、同时输入大气和海洋状态、输出下一时刻两者状态的单一神经网络，还是分别训练大气和海洋模型？我们选择了后者，主要基于三点现实原因：

数据模态与尺度差异：大气和海洋的变量、时空尺度、主导物理过程截然不同。大气变量（如风、温、压、湿）在垂直方向上有复杂的层次结构，变化快；海洋变量（如温度、盐度、流速）则更关注上层海洋的热力结构和缓慢的波动。用一个模型同时学习这两种差异巨大的模式，极易导致训练不稳定和模型偏向于学习变化更快的大气信号，而忽略对长期预测至关重要的海洋慢过程。
训练数据获取与处理：高质量、时空匹配的大气与海洋同步观测数据（再分析资料）虽然存在（如ERA5 for 大气， ORAS5 for 海洋），但将它们完美对齐、处理成适合单一模型输入的格式，工作量巨大。分开训练允许我们使用最成熟、最权威的独立数据集分别优化大气和海洋模型，例如用ERA5训练大气模型，用海洋再分析数据训练海洋模型，灵活性更高。
模型迭代与调试效率：分开训练意味着我们可以独立地改进大气或海洋组件。如果耦合效果不佳，我们可以快速定位是哪个组件的模拟能力有短板，并单独对其进行重新训练或微调，而不必每次都从头训练一个庞大的耦合系统。这在研发初期至关重要。

2.2 耦合接口的设计：抓住主要矛盾

既然分开训练，那么在推理（预测）时，它们如何交互？这就是耦合方案的设计。这里的原则是：抓住海气相互作用中最核心、最直接的变量，避免不必要的复杂性。

根据输入材料，Ola模型的耦合接口设计得非常精炼：

海洋对大气的作用：仅通过海表温度（SST）来强迫大气模型。这是因为在热带地区，SST是影响大气对流、潜热释放和大气环流的最直接、最强的海洋因子。海洋的其他变量（如盐度、深层温度）对大气的影响大多是间接的，且时间尺度更长。简化成SST，大大降低了耦合的复杂度。
大气对海洋的作用：通过一组近地表变量来强迫海洋模型，包括：10米纬向风（10u）、10米经向风（10v）、2米气温（2t）和平均海平面气压（mslp）。风场（10u, 10v）直接提供驱动海洋表层环流和上升流/下降流的“风应力”；2米气温和气压则共同影响海气之间的感热和潜热通量。这些变量是大气驱动海洋环流和热力过程的一阶控制因子。

注意：这个耦合方案是一个强有力的假设。它隐含地认为，SST足以代表海洋对大气的全部重要影响，而风、温、压足以代表大气对海洋的全部重要驱动。这在模拟ENSO等大尺度、慢变过程时是合理的近似，但对于涉及海洋内部波动（如开尔文波、罗斯贝波）细节或强烈局地海气相互作用（如飓风-海洋反馈）的过程，可能需要更精细的接口或额外的变量。

2.3 时间步长的异步处理

另一个巧妙的设计是异步时间步长。大气模型训练时采用24小时的时间步长，而海洋模型采用48小时。在耦合推理时，也遵循这个节奏：每24小时更新一次大气状态，每48小时更新一次海洋状态。

为什么这么做？这符合两者的物理特性。大气过程变化快（天气尺度以天计），需要更频繁的更新来捕捉其演变。海洋过程变化慢（气候尺度以月、季计），较长的步长足以描述其变化，同时可以节省计算量。在耦合循环中，当海洋状态需要更新时，它会使用过去48小时内的大气状态（可能是时间平均或某个时刻的值）作为强迫场。这种异步耦合是物理合理性与计算效率之间的一个很好折衷。

3. 机器学习模型的构建与训练实战

有了清晰的耦合框架，下一步就是构建和训练核心的机器学习组件：大气模型和海洋模型。这部分是项目的基石，决定了整个系统的预测能力上限。

3.1 模型架构选型：为什么是神经算子？

在众多机器学习架构中，Ola项目选择了基于神经算子（Neural Operator）的模型，具体来说是类似FourCastNet或Spherical Fourier Neural Operators (SFNO) 的架构。这并非偶然，而是由气候数据的特点决定的。

气候数据本质上是定义在球面（地球）上的时空场。传统的卷积神经网络（CNN）在处理规则的经纬度网格时，会在极地遇到网格收敛的问题，且难以很好地处理球面的周期性边界条件。神经算子，特别是SFNO，直接在球谐函数空间（谱空间）进行学习，天然地解决了球面问题，并能高效地捕获全球尺度的空间相关性。

我们的实现要点如下：

输入与输出设计：
- 大气模型：输入为t时刻全球范围的多层大气场（如u, v, T, q, Z在多个气压层）和单层场（如SST、地表气压等）。输出为t+24小时后的这些大气场。模型学习的是一个24小时的演化算子。
- 海洋模型：输入为t时刻全球海洋的上层温度场、海表高度场等。输出为t+48小时后的海洋场。模型学习的是一个48小时的演化算子。
- 变量归一化：这是关键一步。每个物理变量（如温度、风场）都有不同的量纲和数值范围。我们必须对每个变量进行全局标准化，即减去其在训练数据集上的长期气候平均，再除以其标准差。这能加速模型收敛，并防止某个量级大的变量主导损失函数。
训练数据与损失函数：
- 数据源：大气部分使用ERA5再分析资料，海洋部分使用相应的海洋再分析资料（如ORAS5或GLORYS）。我们使用了长达数十年的历史数据（例如1994-2016年），并将其按时间顺序切分成连续的“样本对”（输入时刻状态，输出时刻状态）。
- 损失函数：通常采用均方误差（MSE）或加权均方误差。对于不同变量，可以根据其预测重要性赋予不同权重。例如，对于ENSO预测，热带太平洋区域的SST误差权重可以设得更高。我们还会加入谱空间上的正则化项，以鼓励模型学习平滑的、物理上合理的空间模式，避免出现非物理的高频“噪声”。
训练技巧与避坑指南：
- 渐进式预测训练：直接让模型预测未来24或48小时，对于深度学习模型来说可能跨度太大。一个有效的技巧是进行多步滚动训练。即先让模型学会预测未来6小时，稳定后，再用其预测的6小时状态作为输入，训练预测下一个6小时，逐步将预测步长延长到目标值。这能显著提升训练的稳定性和长期预测技能。
- 检查物理守恒性：虽然模型是数据驱动的，但我们仍希望它遵守一些基本的物理约束，例如全球平均温度不应出现无法解释的漂移。在训练后期，可以在损失函数中加入弱约束项，或在后处理中进行简单的偏差校正。
- 警惕过拟合：使用长时间序列数据时，务必做好严格的时间交叉验证。例如，用1994-2010年训练，2011-2016年验证，确保模型学到的是普适的动力学规律，而非特定年份的“记忆”。

4. 耦合推理与滞后集合预报（LEF）工程实现

模型训练好后，真正的挑战在于如何让它们稳定地“跑”起来，并进行有意义的集合预报。这部分是连接算法研究与业务化应用的关键桥梁。

4.1 耦合推理循环的代码级解析

耦合推理是一个自动化的循环过程。我们利用开源的earth2mip项目工具进行流程编排，其核心逻辑如下：

# 伪代码示意耦合推理循环 import numpy as np from atmosphere_model import AtmosModel from ocean_model import OceanModel def coupled_forecast(initial_atmos_state, initial_ocean_state, forecast_length_days): """ 执行耦合预报 initial_atmos_state: 初始大气状态 [变量, 层次, 纬度, 经度] initial_ocean_state: 初始海洋状态 forecast_length_days: 预报总长度（天） """ current_atmos = initial_atmos_state current_ocean = initial_ocean_state # 存储预报结果 forecasts = [] for t in range(0, forecast_length_days * 24, 24): # 以小时计，大气步长24小时 # 1. 大气模型向前积分24小时 # 输入：当前大气状态 + 当前SST（从current_ocean中提取） sst_forcing = extract_sst(current_ocean) atmos_input = combine(current_atmos, sst_forcing) next_atmos = atmos_model.predict(atmos_input) # 预测24小时后大气 # 2. 如果到了海洋更新时间步（每48小时），则更新海洋 if t % 48 == 0: # 输入：当前海洋状态 + 过去48小时的大气强迫（这里简化为使用当前大气状态） # 更精细的做法可对过去两个大气状态取平均 atmos_forcing = extract_atmos_forcing(current_atmos) # 提取10u,10v,2t,mslp ocean_input = combine(current_ocean, atmos_forcing) next_ocean = ocean_model.predict(ocean_input) # 预测48小时后海洋 current_ocean = next_ocean # 3. 更新当前状态，保存结果 current_atmos = next_atmos forecasts.append((current_atmos, current_ocean)) return forecasts

关键细节：

状态初始化：预报开始时（t=0），大气和海洋状态必须来自同一时刻的、协调一致的再分析资料（如UFS-Replay和ERA5），确保初始场是物理上自洽的。
耦合频率：在实际编码中，需要仔细设计数据交换的时序。大气每步都需要SST，而海洋每两步才需要一次大气强迫。需要确保在正确的时刻传递正确的变量切片。
状态变量管理：模型预测的通常是“异常场”或“标准化后的场”。在每次耦合交换前，需要将变量反标准化回物理值；交换后，对于接收方模型，可能又需要将物理值标准化为其训练时使用的格式。这个预处理/后处理链必须准确无误。

4.2 滞后集合预报（LEF）的实操部署

单一的确定性预报在混沌的气候系统中价值有限。我们必须评估预测的不确定性，这就是集合预报的意义。传统物理模型采用扰动初始条件或物理参数的方法来生成集合成员，但这需要复杂的扰动方案设计。LEF为我们提供了一种极其简洁而优雅的替代方案。

LEF的核心思想：既然初始场存在不确定性，而我们又有一个确定的模型，那么我们可以用不同起始时间的初始场，分别启动预报，让这些预报在同一个目标验证时间达到各自的预报时长。这些不同起报、同时验证的预报，就构成了一个集合。

Ola模型中的具体实施步骤：

确定集合大小与起报频率：在论文中，他们每月启动一次为期6个月的预报。为了生成该月的集合，他们在每月头3天的每一天里，每隔6小时（00Z, 06Z, 12Z, 18Z）用当时的分析场初始化一次模型。这样，3天 * 4次/天 = 12个不同的初始场。
运行集合预报：用这12个不同的初始场，分别运行完整的6个月耦合预报。每个预报都是确定性的，没有内部扰动。
构建集合：对于未来第N个月的预测，我们就有12个预报结果，它们分别来自提前N个月至N个月零3天起报的模型积分。这12个结果就构成了对该月状态的滞后集合。
集合产品生成：计算这12个成员的集合平均作为确定性预报，计算其集合离散度（标准差）作为预报不确定性的度量，还可以生成概率预报（如气温高于气候平均的概率）。

LEF的三大优势与一个注意事项：

优势1：参数无关：完全不需要设计复杂的扰动方案，避免了因扰动方法不当引入的偏差。
优势2：计算高效：本质上就是重复运行确定性预报，易于并行化，非常适合在云环境或超算上大规模部署。
优势3：物理一致：每个成员都是模型从某个真实分析场开始的无扰动积分，保持了动力和物理过程的内在一致性。
注意事项：集合离散度可能偏小：因为所有成员都使用同一个“完美”的模型，且初始场之间的差异仅来自几天内的分析误差，这可能导致集合离散度低估真实的不确定性。它更多反映的是“初始条件敏感性”，而非“模型不确定性”。因此，LEF的离散度常被用作预测信度的相对指标，而非绝对度量。

5. 结果评估、偏差分析与调优经验

模型跑起来了，集合也生成了，但工作只完成了一半。如何客观评价其性能，并针对问题进行调整，才是真正体现功力的地方。

5.1 评估指标：不止于相关系数

对于ENSO和S2S预测，常见的评估指标包括：

时间相关系数（TCC）：预测的指数（如Nino3.4区SST指数）与观测指数随时间变化的相关系数。这是衡量预测技巧的核心指标。
均方根误差（RMSE）：衡量预测值与实况值的平均偏差大小。
集合离散度与误差的比率：理想情况下，集合离散度应该与集合平均误差的均方根相匹配。如果离散度远小于误差，说明集合可能过于自信；反之则说明集合过于分散。
可靠性图（Reliability Diagram）：对于概率预报（如“拉尼娜发生概率”），检验预报概率与实况发生频率是否一致。

在我们的实践中，发现一个关键现象：预测误差和偏差具有明显的随预报时效（Lead Time）演变的特征。正如附录C中的偏差图所示，SST和海洋温度的偏差会随着预报时间的延长，在空间分布和量级上发生系统性变化。例如，模型可能在预报第1个月时在西太平洋有冷偏差，到第3个月这个冷偏差可能东移并减弱。

5.2 偏差校正：不可或缺的后处理步骤

上述系统性偏差的存在，意味着我们不能直接使用模型的原始输出作为最终预报产品。偏差校正（Bias Correction）是业务化流程中必须的一环。

我们的做法是：

计算气候态偏差：利用一个长期的“后报”（hindcast）数据集。例如，用1994-2016年每年同月的初始场，运行同样的耦合模型和LEF流程，得到大量的历史预报样本。
按预报时效和空间点计算平均偏差：对于每个预报时效（如第1个月、第2个月…第6个月），每个格点，计算所有后报样本的集合平均与对应观测（或再分析）平均之间的差值。这就得到了一张张“偏差地图”，如图C1-C3所示。
应用校正：在对未来（如2017-2021年）进行实际预报时，将模型原始预报值减去对应时效和位置的预计算偏差。即：校正后预报 = 原始预报 - 气候态偏差。

实操心得：偏差校正看似简单，但细节决定成败。首先，用于计算偏差的后报期必须独立于模型的训练期（如果可能），以避免过拟合。其次，偏差本身可能也存在年际变化或年代际漂移，需要定期（如每5-10年）用最新的后报数据更新偏差文件。最后，对于极端事件的预报，简单的加减法校正可能不够，可能需要更复杂的分位数映射等方法。

5.3 常见问题排查与调优记录

在开发和测试Ola这类耦合ML模型时，我们踩过不少坑，这里分享几个典型的排查思路：

问题：耦合后预报迅速“崩溃”，出现非物理的极端值。
- 可能原因A：大气和海洋模型在各自独立训练时是稳定的，但耦合时交换的变量单位或标准化处理不一致。例如，大气模型期望接收的SST是标准化异常值，而海洋模型输出的却是绝对温度。
- 排查：在耦合接口处插入检查点，打印出交换变量的前几个值，对比其量级与训练数据是否匹配。确保预处理/后处理管道在耦合循环中正确执行。
- 可能原因B：耦合反馈过强。海洋的一个微小变化被大气放大，再反馈回海洋导致更大的变化，形成正反馈爆炸。
- 排查：尝试在耦合变量上施加一个松弛项或时间平滑。例如，不是直接将模型预测的SST传给大气，而是使用SST_new = alpha * SST_pred + (1-alpha) * SST_prev，其中alpha是一个小于1的系数（如0.8），这能有效阻尼高频振荡，增强系统稳定性。
问题：LEF集合离散度在预报后期几乎为零，失去预报意义。
- 可能原因：这是LEF方法的一个固有局限。如果模型动力系统对初始条件的敏感性在预报后期衰减很快（即不同初始场出发的轨迹收敛到一点），那么集合成员就会变得非常相似。
- 应对：这不一定说明模型不好，但提示我们LEF的离散度可能无法充分表征远期的不确定性。此时，需要结合其他不确定性信息，例如考虑多模型集合（将Ola的预报与其他物理模型或不同结构的ML模型的预报结合起来），或者探索在ML模型中引入随机性（如dropout在推理时不关闭）来增加集合扩散。
问题：模型对某些特定事件（如强厄尔尼诺）的预报技巧显著下降。
- 可能原因：训练数据中强事件的样本太少，模型没有充分学习到其演变的特殊规律。
- 调优：在训练时，可以对强厄尔尼诺/拉尼娜年份的样本进行过采样，增加其在训练批次中出现的频率。或者，在损失函数中为这些关键时期和关键区域的预测误差赋予更高的权重，迫使模型更关注这些“难点”。

6. 总结与展望：ML气候预测的机遇与挑战

回顾整个Ola模型的构建过程，从分而治之的模型设计、精炼的耦合接口，到异步时间步长和巧妙的滞后集合方法，每一步都体现了用工程化思维解决复杂科学问题的思路。机器学习为海气耦合模拟打开了一扇新的大门，其核心优势在于效率。一旦训练完成，一个ML模型的推理速度可比传统物理模型快数个量级，这使得进行大规模集合预报、高分辨率实验或快速情景扫描成为可能。

然而，我们必须清醒地认识到，当前的ML气候模型仍然是“黑箱”或“灰箱”。它们卓越的性能建立在历史数据的基础上，对于训练数据分布之外的全新气候状态（如远超历史记录的变暖情景），其外推能力存在巨大疑问。模型的物理一致性、可解释性，以及对极端事件预报的可靠性，仍是亟待攻克的前沿课题。

从工程实践的角度，我认为未来的工作有几个明确的方向：一是发展混合建模，将物理方程以硬约束或软约束的方式嵌入神经网络，增强其物理可信度；二是构建更全面的地球系统ML组件，不仅包括大气和海洋，还应纳入海冰、陆地、植被等过程；三是建立标准化的评估框架和基准测试，就像WeatherBench对于天气预测那样，让不同ML气候模型能在公平的舞台上比较。

这条路还很长，但Ola这样的尝试已经迈出了坚实的一步。它告诉我们，用数据驱动的方法来捕捉和预测地球系统复杂的相互作用，不再只是理论上的可能，而是已经可以运行、可以评估、可以不断迭代的工程现实。对于从事相关领域的同行来说，现在正是深入探索、大胆实践的好时机。

查看全文

http://www.jsqmd.com/news/879439/