当前位置：首页 > news >正文

基于自动微分的Backprop-4DVar：革新数据同化实现的新路径

news 2026/5/24 5:25:34

1. 项目概述：当数据同化遇上自动微分

在数值天气预报、海洋模拟乃至任何基于物理模型的预测领域，我们手里通常有两样东西：一个基于物理定律构建的、能模拟系统演变的数值模型，以及一堆从现实世界采集的、通常稀疏且带有噪声的观测数据。数据同化的核心任务，就是把这两者“揉”在一起，找到一个最优的初始状态，使得从这个状态出发的模型轨迹，能最好地匹配我们拿到的所有观测数据。这就像是给一个复杂的物理模拟游戏，找到一个最合理的“存档点”，让后续的模拟最贴近现实。

传统上，完成这个任务的主力方法是四维变分同化。它本质上是一个大规模的非线性优化问题：定义一个衡量模型轨迹与观测之间差异的“代价函数”，然后通过迭代优化，找到使这个代价函数最小的初始状态。听起来很直接，对吧？但魔鬼在细节里。为了高效地求解这个优化问题，传统4D-Var需要两个关键且极其复杂的“工具”：切线性模型和伴随模型。简单来说，切线性模型描述了初始状态微小扰动如何线性地影响未来的模型状态；伴随模型则反过来，计算代价函数对初始状态的梯度。开发、验证和维护这两个模型，尤其是对于像全球大气环流模型这样包含数百万甚至数十亿个变量的复杂系统，是一项浩大且容易出错的工程，构成了数据同化应用的主要技术壁垒。

过去几年，我一直在关注两个并行的技术浪潮。一个是可微分编程的兴起，以JAX、PyTorch等框架为代表，它们允许我们几乎“免费”地获取任意复杂函数的梯度，彻底解放了开发者的双手。另一个是机器学习气象模型的突破，像GraphCast、Pangu-Weather等模型展现出了惊人的预报潜力。然而，这些ML模型目前严重依赖传统NWP系统提供的初始场（通常是再分析数据），这限制了它们在实时业务预报中的应用。一个自然而然的问题是：能否利用可微分编程和ML优化的思想，来革新传统数据同化的实现方式，甚至为ML模型直接生成高质量的初始场？

最近，我和团队在JAX的加持下，探索并验证了一种全新的4D-Var实现路径，我们称之为Backprop-4DVar。它的核心思想非常“机器学习”：将4D-Var的代价函数视为一个损失函数，利用自动微分直接计算其关于初始状态的梯度，再结合海森矩阵的巧妙近似，用反向传播和梯度下降来完成优化。这个方法不仅绕开了切线性/伴随模型开发这座大山，还能无缝对接传统的可微分数值模型和新兴的机器学习代理模型。实测下来，在多个经典动力系统上，它在保持与传统方法相当甚至更优精度的同时，计算效率提升了一个量级。这篇文章，我就来详细拆解这个方法的原理、实现细节、踩过的坑以及未来的潜力，希望能为从事数值模拟、数据同化和科学机器学习的同行们提供一个可复现的新思路。

2. 核心原理拆解：从传统4D-Var到Backprop-4DVar

要理解新方法的妙处，我们得先看看传统方法是怎么“负重前行”的。

2.1 传统4D-Var的“内外循环”之困

传统的强约束4D-Var旨在最小化如下代价函数：J(x₀) = ½ (x₀ - x_b)^T B⁻¹ (x₀ - x_b) + ½ Σ [yᵢ - H(xᵢ)]^T Rᵢ⁻¹ [yᵢ - H(xᵢ)]其中，x₀是初始状态，x_b是背景场（先验估计），B和R分别是背景误差和观测误差的协方差矩阵，H是观测算子，xᵢ是模型从x₀积分到时刻i的状态。

直接优化这个非线性问题非常困难。因此，操作上广泛采用增量法。它把一个非线性最小二乘问题，转化为一系列线性最小二乘问题的迭代求解，这本质上近似于高斯-牛顿方法。其流程通常包含一个“外循环”和多个“内循环”：

外循环：用当前最优估计x₀ᵏ积分完整的非线性模型，得到参考轨迹，并计算观测增量dᵢ = yᵢ - H(xᵢᵏ)。
内循环：在参考轨迹附近线性化模型（即使用切线性模型M及其伴随Mᵀ），求解一个关于状态增量δx₀的线性最小二乘问题，以最小化线性化后的代价函数Jᵏ(δx₀)。
更新：x₀ᵏ⁺¹ = x₀ᵏ + δx₀，然后回到步骤1，直到收敛。

这个过程的计算瓶颈在于内循环。它需要反复调用切线性模型和伴随模型进行矩阵-向量运算（例如，求解形如(B⁻¹ + Mᵀ Hᵀ R⁻¹ H M) δx₀ = ...的大型线性系统）。对于高维系统，显式构造和存储这些矩阵是不可能的，因此需要设计复杂的迭代求解器（如共轭梯度法）和大量的预条件技术。更棘手的是，切线性/伴随模型的代码开发与物理模型本身紧密耦合，任何模型更新都可能需要重写这部分代码，维护成本极高。

2.2 高斯-牛顿法的另一面：自动微分视角

高斯-牛顿法的迭代公式为：xᵏ⁺¹ = xᵏ - (Fᵀ(xᵏ) F(xᵏ))⁻¹ Fᵀ(xᵏ) f(xᵏ)其中，f(x)是残差向量，F(x)是其雅可比矩阵。对于4D-Var，f(x)就是由背景项和所有观测时刻的观测残差拼接而成的大向量。

关键洞察在于：

梯度计算：∇J(x) = Fᵀ(x) f(x)。这正是代价函数对状态x的梯度。
海森矩阵近似：高斯-牛顿法用Fᵀ(x) F(x)来近似完整的海森矩阵∇²J(x)，忽略了二阶项G(x)。这个近似在残差f(x)较小或问题接近线性时效果很好。

在传统4D-Var中，F(x)对应着线性化的观测算子与切线性模型的组合，计算Fᵀ(x) f(x)需要伴随模型。但如果我们换一种思路呢？

2.3 Backprop-4DVar的核心思想

Backprop-4DVar的核心突破在于，它利用现代自动微分框架，彻底重构了优化流程：

梯度获取：不再手动推导和编码伴随模型。而是将整个代价函数J(x₀)（包含从x₀出发的非线性模型积分和所有观测比较）定义为一个用可微分编程语言（如JAX）编写的函数。然后，直接调用jax.grad(J)(x₀)，自动微分引擎会自动且精确地计算出梯度∇J(x₀)。这个过程在内部通过反向模式自动微分（即反向传播）实现，其计算代价仅约为函数本身求值的2-3倍。
海森矩阵近似：直接计算和求逆完整的Fᵀ F仍然昂贵。我们提出一个实用的近似：Fᵀ(x) F(x) ≈ α⁻¹ [B⁻¹ + H₀ᵀ R⁻¹ H₀]。这个近似仅保留了背景误差和初始时刻观测误差的贡献，忽略了随时间演变的模型线性化部分。α是一个可调的学习率参数。当α⁻¹ I时，该方法退化为标准的梯度下降。
迭代更新：有了梯度∇J和近似海森矩阵H_approx，更新公式变为：x₀ᵏ⁺¹ = x₀ᵏ - H_approx⁻¹ ∇J(x₀ᵏ)。这可以看作是一种预条件的梯度下降。

这个方法为什么有效？

复杂度转移：将开发切线性/伴随模型的人力与工程复杂度，转移给了自动微分框架的计算复杂度。后者由高度优化的编译器（如JAX的XLA）处理，对用户透明。
统一框架：无论底层模型是传统的偏微分方程求解器（只要用JAX等重写），还是一个神经网络代理模型，只要它是可微分的，就可以用同一套Backprop-4DVar代码进行数据同化。这为传统数值模型与ML模型的融合提供了极其便利的桥梁。
计算友好：反向传播和梯度下降算法在现代硬件（GPU/TPU）上具有天然的并行性和优化潜力。虽然我们的实验主要在CPU上进行，但迁移到加速器预计会带来显著的性能提升。

注意：这里海森矩阵的近似是一个权衡。它牺牲了部分理论上的收敛速度（因为忽略了模型动力学的线性化信息），但换来了极低的计算和实现成本。我们的实验表明，在许多场景下，这种近似足以引导优化过程找到高质量的解，且整体计算速度远超传统方法。

3. 实现细节与实操要点

理论很美好，但落地到代码里，每一步都有需要注意的细节。下面我结合在Lorenz-96和准地转模型上的实战经验，拆解Backprop-4DVar的实现关键。

3.1 环境搭建与模型准备

首先，你需要一个可微分的预报模型。这有两种主要路径：

路径一：将传统数值模型“可微分化”如果你的模型原本用Fortran、C++等编写，重写工作量巨大。更可行的策略是：

寻找或移植JAX实现：例如，对于准地转模型，我们使用了pyqg-jax这个库，它是经典PyQG模型的JAX端口。对于Lorenz-96，我们用JAX重新实现了龙格-库塔积分器。
核心要求：模型的时间积分循环必须用JAX的可微分控制流（如jax.lax.scan）实现，避免使用不可微的Python原生循环。所有运算应使用JAX的NumPy API。

import jax import jax.numpy as jnp from pyqg_jax import models # 初始化一个可微分的准地转模型 model = models.QGModel() # 定义模型积分一步的函数，并用jax.jit编译加速 @jax.jit def step_fn(state, t): # model.get_updates 是可微分的 return model.step_model(state, t), None # 使用jax.lax.scan进行可微分的时间积分 def integrate_model(initial_state, num_steps): final_state, _ = jax.lax.scan(step_fn, initial_state, xs=jnp.arange(num_steps)) return final_state

路径二：使用可微分的机器学习代理模型当原模型代码不可微分或计算昂贵时，可以训练一个ML模型来近似其动力学。我们使用了储层计算模型，因为它结构简单、训练高效，且在模拟混沌动力系统方面表现出色。

模型结构：RC的核心是一个随机生成且固定的稀疏递归网络（储层），仅训练一个简单的线性输出层。其动力学为：r(t) = α * tanh(A r(t-1) + W_in u(t-1) + b) + (1-α) * r(t-1)，预测为u(t) = W_out r(t)。
训练：在历史数据（“真实”模型积分结果）上，通过最小化预测误差来训练输出层权重W_out和几个宏观参数（如泄漏率α）。训练好的RC模型是一个完全可微分的动力系统，可以作为M在Backprop-4DVar中使用。
同化空间：一个技巧是，在同化循环中，我们直接在储层状态空间r中进行优化，而不是原始物理空间。观测算子H变为S @ W_out，其中S是从全状态空间到观测位置的映射矩阵。

3.2 代价函数与梯度的JAX实现

这是Backprop-4DVar的核心。我们需要用JAX定义一个函数，输入初始状态x0，输出标量代价J。

import jax def fourdvar_cost(x0, background_state, observations, obs_times, obs_operator, model_integrate, B_inv, R_inv): """ 计算4D-Var代价函数。 参数: x0: 初始状态（优化变量） background_state: 背景场 x_b observations: 列表，每个元素是对应时刻的观测向量 obs_times: 观测时刻列表 obs_operator: 可微分的观测算子 H model_integrate: 可微分的模型积分函数，输入x0和积分步数，输出轨迹 B_inv, R_inv: 背景和观测误差协方差矩阵的逆（这里假设为对角阵，用向量表示） """ # 1. 背景项 background_diff = x0 - background_state background_term = 0.5 * jnp.dot(background_diff, B_inv * background_diff) # 2. 积分模型得到整个时间窗口的状态轨迹 # 假设model_integrate返回所有时间步的状态 full_trajectory = model_integrate(x0, window_length) # 3. 观测项 obs_term = 0.0 for i, t in enumerate(obs_times): state_at_t = full_trajectory[t] # 获取t时刻的状态 obs_diff = observations[i] - obs_operator(state_at_t) obs_term += 0.5 * jnp.dot(obs_diff, R_inv[i] * obs_diff) total_cost = background_term + obs_term return total_cost # 关键步骤：使用jax.grad自动获取梯度函数 cost_grad = jax.grad(fourdvar_cost) # 现在，cost_grad(x0, ...) 将返回代价函数关于x0的梯度∇J

实操要点：

内存考虑：反向传播需要存储前向计算的所有中间状态，对于长同化窗口，内存可能爆炸。JAX提供了jax.checkpoint（或remat）来自动进行梯度检查点，以时间换空间。
误差协方差矩阵：在原型实验中，我们通常假设B和R是对角矩阵（即各变量误差独立），这简化了计算。在实际应用中，B通常包含空间协结构，需要更复杂的建模（如扩散算子）。Backprop-4DVar框架本身不限制协方差矩阵的形式，只要其逆与向量的乘法是可微操作即可。
观测算子：H必须也是用JAX实现的可微函数。对于简单的网格点插值或变量选择，这很容易实现。

3.3 优化循环与学习率调参

有了梯度函数，优化循环就非常类似于训练一个神经网络：

def backprop_4dvar(initial_guess, background, observations, ...): x = initial_guess learning_rate = 0.5 # 初始学习率 decay_rate = 0.95 # 每轮衰减率 num_iterations = 3 # 类似外循环次数 for k in range(num_iterations): # 计算当前代价和梯度 cost = fourdvar_cost(x, ...) grad = cost_grad(x, ...) # 构建近似海森矩阵的逆（对角假设下非常简单） # H_approx_inv = α * (B + H0^T R H0) 的逆的近似 # 简化版：使用对角矩阵，逆就是逐元素倒数 # 这里用一个简单的预条件器：H_approx_inv = learning_rate * I (即梯度下降) # 更复杂的近似可以加入B和R的信息 preconditioner = learning_rate # 这里简化为标量学习率 # 更新状态 x = x - preconditioner * grad # 衰减学习率 learning_rate *= decay_rate return x, cost

学习率调参是成功的关键。我们的经验是：

敏感性：Backprop-4DVar对学习率α和衰减率α_decay非常敏感。太大导致梯度爆炸，优化发散；太小则收敛缓慢，在同化窗口内无法找到好解。
自动化调优：我们强烈建议使用超参数优化工具（如Ray Tune、Optuna）在独立的验证数据集上进行贝叶斯优化搜索。在我们的实验中，搜索空间通常设为：α在[e⁻⁵, 1.0]之间，α_decay在[0.1, 0.99]之间。
经验起点：对于许多系统（如Lorenz-96, PyQG），α=0.5，α_decay=0.5是一个不错的起点。但对于更复杂的系统或使用ML代理模型时（如我们的qgs+RC实验），最优学习率可能小得多（我们找到了α=0.019）。
迭代次数：类似于传统4D-Var的外循环次数，3-5次迭代通常足够。更多迭代可能带来边际收益，但计算成本增加。

3.4 与传统4D-Var的接口对比

为了公平比较，我们用JAX也实现了一个标准的增量4D-Var。其内循环需要显式构造切线性模型和伴随模型，并调用迭代线性求解器（我们用了双共轭梯度稳定法BI-CGSTAB）。对比之下，Backprop-4DVar的代码简洁得令人发指——大部分复杂性被封装在jax.grad这个黑盒里了。传统方法的实现涉及复杂的线性代数操作和手动导数推导，而新方法几乎就像在写一个普通的优化问题。

4. 实验结果与性能分析

我们在两个经典混沌系统上进行了大量实验：洛伦兹96模型和两层准地转模型。

4.1 Lorenz-96系统：精度与效率的基准测试

Lorenz-96是一个低维但具有混沌特性的理想化模型，常被用作数据同化算法的“试金石”。我们测试了不同观测数量（6到36个变量，总维度36）和不同观测噪声水平（标准差0.1到2.0）下的表现。

关键发现：

精度相当：在大多数观测配置下，Backprop-4DVar（无论是使用精确海森矩阵还是近似海森矩阵）与传统4D-Var的分析误差（RMSE）统计上无显著差异。下图展示了在18个观测、噪声0.5的典型配置下，两种方法都能有效地将自由运行（无同化）的发散轨迹拉回至真实轨迹附近。
优势场景：在观测较多、噪声较大的情况下，Backprop-4DVar有时表现略优。而在观测稀疏、噪声极低的情况下，两者互有胜负，没有一致赢家。这表明新方法在挑战性场景下并不逊色。
计算效率：随着系统维度从6增加到256，传统4D-Var的计算时间呈近似二次方增长，而Backprop-4DVar的增长则接近线性。在256维系统中，Backprop-4DVar（近似海森）比传统4D-Var快了一个数量级。这主要是因为传统方法的内循环需要昂贵的矩阵-向量乘法，而Backprop-4DVar的核心是向量化的梯度计算和简单的点乘更新。

系统维度	传统4D-Var 平均耗时 (秒)	Backprop-4DVar (近似) 平均耗时 (秒)	加速比
6	0.12	0.08	1.5x
36	0.85	0.15	5.7x
144	12.4	0.68	18.2x
256	41.7	1.52	27.4x

表：Lorenz-96系统上，不同维度下单次同化分析窗口的平均计算时间对比（50次试验平均）。

4.2 准地转模型：迈向更复杂的空间扩展系统

QG模型是更接近真实流体动力学的二维空间扩展系统，我们测试了从512到8192个网格点的不同分辨率。

结果一致性：在PyQG-JAX实现的QG模型上，结论与Lorenz-96类似。三种方法（传统4D-Var， Backprop-4DVar精确海森， Backprop-4DVar近似海森）产生的状态估计精度（RMSE）非常接近。下图展示了2048维系统底层涡度场在三个不同时刻的误差对比，可以看到Backprop-4DVar与参考方法（传统4D-Var）的误差模式在量级和空间分布上都非常相似。

效率优势放大：在更高维的QG系统上，Backprop-4DVar（近似海森）的计算效率优势更加明显。在8192维（2层64x64网格）的测试中，我们仅运行了Backprop-4DVar（近似），因为它在大尺度问题上的可行性已由低维结果预示，而传统方法在此尺度上的计算成本已变得非常高。Backprop-4DVar成功地将整个测试期的平均RMSE控制在3.43×10⁻⁷，与低分辨率下的精度相当。

踩坑记录：在首次将Backprop-4DVar应用于QG模型时，我们遇到了梯度爆炸的问题。原因是模型积分步数较多（同化窗口内），导致反向传播的计算图过深，梯度数值不稳定。解决方案有两个：1）使用jax.checkpoint对积分循环进行重计算，牺牲一些计算时间换取内存和数值稳定性；2）仔细调整学习率和衰减率，这是保证收敛的最关键超参数。我们最终通过Ray Tune的自动搜索找到了稳定的参数组合。

4.3 当模型不可微：储层计算代理模型的成功应用

为了验证Backprop-4DVar与ML模型的兼容性，我们使用qgs包（一个非JAX的QG模型）生成数据，训练了一个储层计算模型作为预报器，然后在储层状态空间中进行数据同化。

挑战与方案：

空间转换：观测存在于原始物理空间，而优化变量在储层空间。因此，观测算子H变为S @ W_out，其中W_out是RC模型的读出矩阵，S是选择矩阵。这要求W_out必须是可微的（它本身就是可训练参数）。
初始化：RC模型需要一段“spin-up”时间使其内部状态与真实系统同步。我们在同化实验开始前，用一段加噪的“瞬变期”数据来驱动RC模型，使其隐藏状态接近（但不等于）真实初始状态。
误差协方差：背景误差协方差B现在定义在储层空间，其尺度需要根据储层状态的气候学标准差来设定。

结果：尽管使用了近似动力学的代理模型，Backprop-4DVar依然能够有效地利用稀疏噪声观测，显著改善对真实轨迹的估计。下图对比了无同化的自由运行和经过Backprop-4DVar同化后的三个变量（两个被观测，一个未被观测）的时间序列。可以看到，同化后的轨迹（橙色）紧密地跟踪着真实轨迹（蓝色），而自由运行（绿色）很快发散。这证明了该方法在“模型不可微但可用可微代理替代”这一重要场景下的可行性。

5. 常见问题、挑战与实战建议

在实际实现和应用Backprop-4DVar的过程中，我们遇到了不少典型问题，也总结出一些经验。

5.1 梯度问题：爆炸、消失与数值稳定性

梯度爆炸：在深度计算图（长积分窗口）中尤其常见。
- 排查：在优化循环中打印梯度的范数（jnp.linalg.norm(grad)）。如果出现NaN或异常大的值，很可能发生了爆炸。
- 解决：
  1. 降低学习率：这是最直接有效的方法。
  2. 梯度裁剪：在更新前对梯度进行裁剪，grad = jnp.clip(grad, -clip_value, clip_value)。
  3. 使用检查点：jax.checkpoint可以减少内存并可能改善数值行为。
  4. 检查模型：确保你的可微分模型本身是数值稳定的，没有导致梯度异常的操作（如除以极小的数）。
收敛缓慢或震荡：
- 原因：学习率太小或太大，海森矩阵近似太粗糙。
- 解决：
  1. 系统性的超参数调优：不要手动试，一定要用自动调参工具在验证集上搜索。
  2. 改进预条件器：我们的近似海森α⁻¹(B⁻¹ + H₀ᵀ R⁻¹ H₀)是一个起点。可以尝试纳入更多信息，例如使用对角化的背景误差协方差B的实际逆，或者考虑加入低秩的流依赖信息。
  3. 尝试更高级的优化器：我们目前使用了简单的带衰减的梯度下降。可以轻松替换为Adam、L-BFGS等更复杂的优化器，JAX生态中有optax库提供了丰富选择。

5.2 计算资源与性能优化

CPU vs GPU/TPU：我们的实验主要在CPU上运行。JAX的优势在于其代码可以几乎不加修改地在GPU/TPU上运行。对于大规模问题，将模型积分和梯度计算转移到加速器上预计会带来巨大的速度提升。未来工作的一个明确方向就是进行GPU基准测试。
内存瓶颈：长窗口的反向传播是内存消耗大户。
- 策略：除了使用jax.checkpoint，还可以考虑窗口化同化。将长同化窗口分成重叠的较短子窗口，依次进行Backprop-4DVar，然后将最终状态作为下一个窗口的背景场。这类似于连续数据同化循环，能有效控制内存。
与传统优化代码的对比：有同行可能会质疑，我们对比的“传统4D-Var”实现可能不是最优化的。确实，业务化系统（如ECMWF的IFS）采用了大量优化技巧，如增量分析更新、多分辨率内循环等。然而，Backprop-4DVar的价值在于其实现的简易性和通用性。它避免了整个切线性/伴随模型基础设施的构建，为研究和快速原型开发提供了巨大便利。其近乎线性的缩放性能也预示了其在超大规模问题上的潜力。

5.3 与传统/混合系统的集成路径

渐进式替代：对于现有业务系统，完全重写模型为JAX可能不现实。一个可行的路径是双系统并行。在研发端，用JAX构建一个简化或降阶的可微分模型，利用Backprop-4DVar进行快速算法测试、参数敏感性研究或集合生成。成熟后再将方案移植到生产系统。
ML模型初始化：这是Backprop-4DVar最直接的应用场景之一。像GraphCast这样的ML预报模型，可以直接将其作为一个可微分函数M嵌入到Backprop-4DVar框架中。这样，就可以利用实时观测，为ML模型生成最优的初始条件，从而摆脱对传统NWP分析场的依赖，实现端到端的ML预报流程。
与集合方法的结合：Backprop-4DVar本质上是一个变分方法。它可以与集合方法结合，例如用集合来估计流依赖的背景误差协方差B，然后将其作为预条件器融入Backprop-4DVar的近似海森计算中，形成一种混合同化方案。

5.4 代码复现与扩展

我们已将完整的实验代码和数据分析笔记本开源：

核心算法库DataAssimBench: https://github.com/StevePny/DataAssimBench
示例与绘图DataAssimBench-Examples: https://github.com/StevePny/DataAssimBench-Examples

给想要复现或扩展此工作的朋友的建议：

从小开始：先用Lorenz-96模型练手。它的维度低，代码简单，可以快速验证你的Backprop-4DVar实现是否正确（比如，对比有限差分计算的梯度与jax.grad计算的梯度是否一致）。
理解你的自动微分：花点时间学习JAX的jax.vjp,jax.jvp，理解前向模式和反向模式的区别。这有助于你调试复杂的梯度计算。
精心设计实验：像我们一样，明确划分训练集、验证集、瞬变期和测试集。特别是在使用ML代理模型时，这能确保评估的公正性。
可视化是关键：不仅要看RMSE数字，一定要绘制状态空间的时间序列图、空间误差场图。这能帮你直观理解算法在哪里成功，在哪里失败。

Backprop-4DVar不仅仅是一个算法技巧，它代表了一种思维方式的转变：将数据同化这个传统上高度专业化、依赖于特定数值软件生态的领域，转变为一种可以受益于现代机器学习工具和硬件加速的通用优化问题。它降低了数据同化的实现门槛，为更紧密地集成物理模型、机器学习与实时观测数据开辟了一条新路。在我个人看来，它的最大潜力在于其灵活性——无论是探索新的观测算子、试验复杂的误差协方差模型，还是快速集成一个刚出炉的神经网络参数化方案，Backprop-4DVar都能让你用相对较少的代码更改来测试这些想法。当然，将其应用于真正的全球预报模型并评估其在业务场景下的成本和效益，是下一步必须面对的挑战，但这扇门已经被推开了。

查看全文

http://www.jsqmd.com/news/875343/