当前位置：首页 > news >正文

物理嵌入神经网络：融合高光谱廓线与卫星图像提升对流临近预报

news 2026/7/15 16:47:59

1. 项目概述：当深度学习遇见大气物理

作为一名长期混迹于气象与人工智能交叉领域的研究者，我常常思考一个问题：我们能否让AI模型不仅“看到”天气现象，更能“理解”其背后的物理规律？传统的对流起始（Convective Initiation, CI）临近预报，主要依赖卫星云图的经验阈值和雷达回波的追踪，但面对其突发性、局地性和生命史短的特点，预报的提前量和准确性始终是瓶颈。深度学习模型，尤其是卷积神经网络（CNN）和U-Net等架构，在处理卫星图像序列预测方面取得了显著进展，但它们本质上还是“数据驱动”的黑箱——模型学到了统计规律，却未必理解“为什么”云会发展成对流。

这正是我们这项工作的出发点。我们尝试走一条“物理引导的数据驱动”路线。简单来说，我们不满足于让模型仅仅学习卫星图像上云顶亮温的时空演变模式，我们还想让它“感受”到大气层结是否“憋着一股劲”——即大气的热力不稳定能量。这股能量，在气象学中有一个经典的量化指标：对流有效位能（Convective Available Potential Energy, CAPE）。CAPE值越高，意味着一旦有触发机制，潜在的对流发展能量就越强。然而，CAPE的计算依赖于高垂直分辨率的大气温湿度廓线，而常规的探空观测一天只有两次，根本无法捕捉对流爆发前几小时内的快速变化。

幸运的是，现代遥感技术提供了新的可能。地基红外高光谱干涉仪（AERI）和静止轨道高光谱红外探测仪（如FY-4A/GIIRS）的协同反演，能够以10分钟级的高时间分辨率，获取局部地区从地面到高空的大气温湿度垂直分布（即大气廓线）。这就像给预报员装上了一台可以持续“把脉”大气状态的监视器。与此同时，葵花8号/9号（Himawari-8/9）等新一代静止气象卫星提供的多光谱红外图像，则以5分钟的高频次，为我们呈现云顶发展的精细时空结构。

于是，一个核心构想诞生了：能否构建一个深度学习模型，其输入端同时“喂入”代表大气热力状态的高时间分辨率廓线数据，和代表云动力发展过程的高时空分辨率卫星图像，并在模型内部显式地嵌入CAPE计算这一物理知识，让网络在学习过程中，自然而然地建立起“不稳定能量积累”与“云体爆发”之间的物理关联？本文要分享的，正是基于这一构想所设计、实现并验证的一个物理嵌入神经网络模型，它致力于解决未来0-6小时内的局地对流起始临近预报难题。无论你是从事气象预报的业务人员，还是研究AI for Science的算法工程师，亦或是关注交叉学科应用的学生，相信这个将物理方程与数据网络深度融合的实战案例，都能给你带来启发。

2. 核心思路与模型架构设计

2.1 问题定义与数据特性分析

首先，我们需要明确“对流起始临近预报”这个任务的具体设定。我们的目标是，给定过去一段时间内某个固定地点（以地基观测站为中心）的观测数据，预测该地点在未来6小时内（以10分钟为间隔）是否会发生对流起始。这里“发生”的定义，参考了再分析资料和雷达观测，通常指该地点周边一定范围内（如25km×25km）出现由对流产生的有效降水。

我们的数据来自两个异构的源头：

大气温湿度廓线序列：来自AERI与FY-4A/GIIRS的协同反演结果。时间范围覆盖预报起始时刻（T=0）前6小时到前2小时，共4小时，时间分辨率约10分钟。数据形态是随时间变化的一维垂直剖面，包含了从地面到约15公里高度的大气温度和湿度信息。这是我们的“热力状态”输入。
卫星多光谱图像序列：来自Himawari-8/9的AHI传感器。时间范围覆盖T-2小时到T=0时刻，共2小时，时间分辨率10分钟，空间范围是以站点为中心的320km×320km区域。我们选取了对流云顶特征敏感的5个红外通道（如10.4μm、12.4μm等）。这是我们的“云动力发展”输入。

这里就引出了第一个关键设计：非对称数据融合策略。为什么廓线要看前4小时，而云图只看前2小时？这源于我们对对流发展物理过程的理解。在对流爆发前的“酝酿期”（比如T-6到T-2小时），可能天空还是少云或晴空状态，卫星云图上几乎看不到明显的云系信号。但这个阶段，大气底层可能正在悄悄积累热量和水汽，层结不稳定性在逐步增强。此时，高时间分辨率的廓线数据是捕捉这种“暗流涌动”的关键。而到了临近爆发的“发展期”（T-2到T=0小时），积云开始垂直发展，云顶亮温迅速降低，卫星图像上的纹理、形状和光谱特征变得异常丰富和关键。因此，让模型在不同阶段关注不同类型数据的主导信息，是符合物理直觉的。后文的消融实验也证实，这种“4小时廓线+2小时云图”的组合策略，取得了最佳的预报效果。

2.2 整体网络架构：从多流到单流的融合预测

我们的模型整体上是一个“多流特征提取 + 单流融合预测”的编码器-解码器结构，如图1所示（注：此处为文字描述，原论文有示意图）。模型主要由三个核心模块串联而成：

空间-光谱卷积特征提取模块：负责处理卫星多光谱图像序列。该模块基于改进的ResNet架构，其核心任务是提取单时刻图像在空间维度和光谱维度上的联合特征。想象一下，我们不是简单地把5个通道的图像堆叠起来，而是通过卷积层，让网络学习不同红外通道组合所揭示的云物理特性（如云顶高度、粒子大小等）。该模块对输入序列的每一帧独立处理，输出一个包含丰富语义信息的特征张量序列。
物理嵌入的大气热力特征提取模块：这是本文的创新核心，负责处理大气廓线序列。其目标不是简单地用全连接层或LSTM去“黑箱”地学习廓线变化，而是将CAPE方程以可微分、带可学习参数的形式，显式地嵌入到网络前向传播过程中。该模块的输出是一个表征大气不稳定度演变趋势的特征张量序列。
融合预测模块：接收上述两个特征序列作为输入。其主体是一个基于U-Net改进的时空序列预测网络，内部包含了卷积层、采样层以及我们设计的对流特征注意力块。该模块的任务是学习两个异构数据流在时间上的自相关特征以及彼此之间的跨模态关联特征，最终解码出未来6小时、每10分钟一个的是否发生CI的二分类概率。

整个模型的训练采用“预训练-微调”的策略。首先，使用大量的ERA5再分析资料（作为廓线真值）和对应的卫星图像进行预训练，让模型学习一个较好的初始权重。然后，用少量真实协同反演的廓线数据替换ERA5数据，与同期卫星图像配对，对模型参数进行微调，使其适应真实观测的分布。这种策略有效解决了真实反演数据量相对较少的问题，提升了模型的泛化能力。

3. 核心模块深度解析与实现细节

3.1 物理嵌入的大气热力特征提取模块：让网络“学会”计算CAPE

这是整个模型的灵魂所在，也是区别于纯数据驱动方法的关键。传统的CAPE计算，是对一个从地面抬升的假想气块，计算其温度与环境温度差异所产生的浮力积分。公式虽经典，但直接用到神经网络里有几个问题：1) CAPE是单一标量，信息损失大；2) 实际对流触发的气块抬升起点不一定在地面；3) 公式中的一些简化假设（如绝热过程）可能与复杂实际情况有偏差。

我们的设计巧妙地解决了这些问题，如图3所示（注：此处为文字描述）。模块分为物理嵌入部分和纯数据驱动部分。

物理嵌入部分：

多起点抬升：我们不仅计算从地面（第一层）开始的CAPE，还计算从近地面多个不同高度层（例如，2公里以下每隔几百米取一层）作为起点的“类CAPE”指数。这相当于让网络同时考虑不同层次可能存在的触发机制，扩大了其对热力特征的“感受野”。
可学习修正：我们在原始的CAPE积分公式中，引入了一个可学习的权重系数W_c,n。这个系数会对不同高度层、不同积分环节的贡献进行加权。在训练过程中，这个系数会通过反向传播自动优化。这意味着，网络不是死板地套用物理公式，而是以这个公式为“模板”或“引导”，学习出一个对当前预报任务最有效的、修正后的“广义不稳定度指数”。公式可以简化为：I_n = W_c,n * ∫ (g * (T_v,parcel - T_v,env) / T_v,env) dz其中，I_n就是从第n层开始抬升计算出的特征值。
虚拟温度计算：我们严格根据气象学定义，利用输入的温度(T)和比湿(Q)廓线，计算环境空气和抬升气块的虚拟温度(T_v)，因为虚温修正包含了水汽的影响，对浮力计算至关重要。

纯数据驱动部分：在物理嵌入计算的同时，原始的温度和湿度廓线也会通过一个由全连接层和1D卷积层组成的子网络。这个子网络的任务是捕捉那些CAPE方程未能描述、但对预报可能有益的复杂非线性特征，例如湿度垂直分布的细微结构、温度廓线的特殊形态等。

最后，将物理嵌入部分计算出的多通道特征（每个通道代表一个抬升起点的指数）与数据驱动部分提取的特征进行拼接，再通过一个全连接层融合，输出最终的大气热力特征张量。

实操心得：在实现这个模块时，最大的挑战是确保物理计算部分（如虚温计算、积分）是可微分的，以便梯度能够回传。我们使用PyTorch的自动微分功能，将CAPE的积分过程离散化为对垂直层求和的张量运算，从而实现了整个模块的端到端训练。初始化时，我们将可学习权重W_c,n设置为接近1的值，相当于让网络从标准CAPE公式开始学习。

3.2 空间-光谱卷积特征提取模块：从图像中读懂云的“语言”

卫星多光谱图像是三维数据体（空间X × 空间Y × 光谱通道）。我们的目标是提取对CI敏感的空间-光谱联合特征。我们采用了基于ResNet的架构，但进行了适应性的修改。

模块由一系列“残差块”构成，主要包含两种类型：

ResNet Block-1：主要进行下采样和通道扩增。输入特征图经过一个步长为2的3×3卷积，空间尺寸减半，通道数翻倍。通过残差连接，保留了原始信息，缓解了梯度消失问题，便于训练更深的网络。
ResNet Block-2：主要进行深层特征提取。输入输出空间尺寸和通道数保持不变，通过多个3×3卷积层挖掘更深层次的特征。

对于时间序列，我们对每一帧图像独立通过该模块，得到一个特征向量。所有时间步的特征向量按时间顺序排列，就构成了卫星图像的特征序列。

注意事项：卫星数据预处理至关重要。除了常规的地理坐标重采样、归一化外，我们特别进行了云检测和晴空筛选。因为用于反演廓线的红外高光谱数据要求晴空或部分晴空条件，我们需要确保输入模型的卫星图像时段与廓线反演时段在云况上是大致匹配的，否则特征会不对齐。我们结合Himawari的官方云产品和基于红外光谱的云检测算法，对输入数据进行了质控。

3.3 融合预测模块与对流特征注意力机制

两个异构的特征序列（热力特征和图像特征）需要被有效地融合并用于时间序列预测。我们设计了一个以U-Net为骨架，融合了Transformer中自注意力机制的编码器-解码器网络。

编码器-解码器结构：编码器通过卷积和下采样，逐步压缩空间/通道维度，提取高层抽象特征；解码器通过上采样和卷积，逐步恢复细节，生成预测序列。跳跃连接将编码器中的低层、高分辨率特征直接传递到解码器的对应层，弥补了在下采样过程中可能丢失的细节信息，这对捕捉云系发展的精细时空变化很有帮助。
对流特征注意力块：这是融合模块中的关键子结构。其核心是一个多头自注意力机制。为什么需要注意力？因为在对流发展过程中，不同时间步的特征重要性是不同的，且热力特征和图像特征之间存在动态的关联。例如，在早期，某个高度层温度的异常增暖（热力特征）可能更重要；而在云爆发前，云顶的快速冷却（图像特征）成为主导信号。
- 工作原理：将融合后的特征序列视为一组向量。通过可学习的线性变换，为每个时间步的特征生成查询向量、键向量和值向量。注意力机制通过计算查询与所有键的相似度（点积后缩放），得到一组权重，然后用这组权重对值向量进行加权求和。这样，当前时间步的输出就包含了整个序列中所有时间步信息的加权汇总，权重的大小代表了其他时间步信息对当前步的重要性。
- 多头设计：使用多个并行的“注意力头”，每个头学习不同子空间的特征关系，最后将结果拼接起来。这增强了模型捕捉不同类型依赖关系的能力。
输出与损失函数：解码器的最终输出通过一个卷积层和Sigmoid激活函数，映射为未来6小时（36个时间步）每个步长的CI发生概率（0到1之间）。我们使用二元交叉熵损失作为训练目标，它衡量模型预测的概率分布与真实标签（0或1）之间的差异。

4. 实验设置、训练技巧与结果分析

4.1 数据准备与实验设计

我们使用了青岛（2021全年）和杭州（2023年8-10月）两个站点的观测数据。廓线数据来自AERI与FY-4A/GIIRS的协同反演，卫星数据来自Himawari-8/9。CI的“真值”标签，在预训练阶段来自ERA5再分析资料中的对流性降水数据，在最终验证阶段则来自中国气象局天气雷达拼图数据（定义站点周边25km范围内组合反射率CR超过35dBZ为CI发生）。

我们将数据按时间顺序划分为训练集、验证集和测试集。模型在PyTorch框架下实现，使用4块NVIDIA RTX 4090 GPU进行训练。优化器选用Adam，学习率采用余弦退火调度。由于正负样本不均衡（CI事件相对稀少），我们在损失函数中引入了类别权重，给予正样本更高的权重，以缓解模型倾向于预测“无对流”的问题。

我们设计了多组对比实验来验证各个部分的有效性：

实验组A（物理嵌入 vs. 纯数据驱动）：将我们提出的物理嵌入热力特征模块，替换为LSTM、Transformer、TCN等经典的序列模型，其他部分保持不变，对比预报效果。
实验组B（多模态 vs. 单模态）：仅使用卫星图像作为输入，去掉整个廓线数据流，验证增加大气热力信息的作用。
实验组C（不同输入时长组合）：调整廓线和卫星图像的输入时间窗口比例（如2小时廓线+4小时云图），验证非对称融合策略的合理性。

4.2 核心评估指标解读

在气象预报中，常用的二分类评估指标包括：

临界成功指数：CSI = TP / (TP + FP + FN)。它同时考虑了漏报和空报，是一个综合性的评分指标，值越高越好。它是我们结果分析中的核心指标。
命中率：POD = TP / (TP + FN)。衡量模型捕捉真实事件的能力，越高说明漏报越少。
成功率/精确率：PRE = TP / (TP + FP)。衡量模型预报的可靠性，越高说明空报越少。

4.3 结果分析与讨论

4.3.1 物理嵌入的有效性验证

在基于ERA5再分析资料的对比实验中（图8），我们提出的物理嵌入模块（曲线a）在0-5小时的预报窗口内，CSI得分持续高于使用LSTM、Transformer、TCN等纯数据驱动模块的模型。这初步证明了将CAPE物理知识嵌入网络，能够更有效地从廓线数据中提取对预报有用的热力不稳定信息。

在基于真实反演廓线和卫星图像的终极测试中（图9），结论更加显著：

多模态 vs. 单模态：我们完整的模型（曲线a）的6小时平均CSI达到0.62，而仅使用卫星图像的模型（曲线b）平均CSI仅为0.44。引入高时间分辨率的红外高光谱反演廓线数据，带来了约40%的CSI相对提升。这强有力地证明了，在对流临近预报中，融合代表大气“潜势”的热力信息至关重要。
物理嵌入 vs. 纯数据驱动：在同样使用廓线+图像双输入的情况下，我们的物理嵌入模型（曲线a）的6小时平均CSI为0.62，而使用LSTM、Transformer、TCN提取廓线特征的模型（曲线c, d, e）平均CSI在0.46左右。物理嵌入带来了约35%的相对提升。这表明，显式的物理引导比让网络完全从零开始学习热力特征更高效、更有效。

此外，我们的模型在命中率上表现尤为突出（图10a，平均POD=0.87），显著高于对比模型（0.63-0.67），说明我们的模型更擅长“捕捉”到即将发生的对流事件，这对于防灾减灾的预警应用意义重大。虽然在3小时后的成功率有所下降，但平均成功率仍与最优的对比模型持平或略高。

4.3.2 模型的可解释性分析

物理嵌入的一大优势是提升了模型的可解释性。我们分析了模型内部热力特征提取模块的输出（即那些“广义不稳定度指数”）。图16展示了在CI发生和不发生的样本中，模块计算出的特征值（对应从近地面层开始抬升的通道）的变化率，与用ERA5数据按标准CAPE公式计算值的变化率的对比。

结果发现，在CI发生的样本中，两者变化趋势高度一致：在爆发前数小时，CAPE变化率缓慢上升，在爆发前约4.5小时达到峰值后开始下降；而我们模型学到的特征值变化率也呈现类似的先升后降趋势，只是下降拐点略早。在CI不发生的样本中，两者均呈下降或平稳趋势。这表明，我们的模型确实通过物理嵌入的引导，学习到了与CAPE物理意义相似的不稳定度演变模式。更进一步，图17显示，模型通过多通道（多抬升起点）计算，将一维的CAPE扩展成了一个二维的、包含更多层次信息的特征矩阵，这可以理解为网络对物理知识的一种泛化和深化。

4.3.3 不同场景下的性能表现

不同降水强度：我们将测试集中的正样本按最大降水率分为弱、中、强三个等级。如表IV所示，在所有等级上，引入廓线数据的模型均优于仅用卫星的模型，且我们的物理嵌入模型在各级别上都是最优的。特别地，对于最强的Level-3降水，我们的模型优势最明显，说明其对强对流事件的预报能力更强。
不同地域与季节：模型在杭州（2023年8-10月）的预报性能略优于青岛（2021年同期）（图11a）。我们分析这可能与两地的气候背景有关。杭州纬度更低，水汽更充沛，局地热力条件对对流触发的作用更直接，而CAPE正是刻画热力不稳定度的指标，因此模型在杭州表现更好。在青岛，中纬度天气尺度系统的影响可能更复杂。在不同季节（春、夏、秋）的测试中，模型在青岛的表现差异不大（图11b），显示了较好的季节适应性。

4.3.4 基于雷达观测的真实案例验证

我们使用2021年5月青岛地区的雷达组合反射率数据作为真值，对模型预报结果进行了严格的独立检验。图12b显示，在雷达观测的验证下，我们模型的6小时平均CSI为0.31，是仅用卫星图像模型（0.14）的两倍以上，也比最好的纯数据驱动对比模型（TCN，0.24）高出约29%。这再次在独立数据源上证实了物理嵌入和多模态融合的价值。

图13和图14展示了两个强对流个例的预报与雷达实况对比。以5月26日过程为例，模型在雷达回波开始显著增强（约第4预报小时）前约1小时（第3小时10分）就成功预报了对流起始，且预报的对流时段与雷达观测到的强回波时段有很好的重叠。这表明模型具备了对强对流过程的有效提前预警能力。

5. 局限、挑战与未来展望

尽管模型取得了不错的性能，但在实际业务化应用的路上，仍有不少挑战需要攻克：

数据的时空局限性：目前使用的反演大气廓线是单点的、垂直一维的。它完美刻画了站点上空大气柱的热力状态随时间的变化，但完全缺失了水平空间信息。对流的发生发展是一个三维过程，上下游系统的平流、辐合等动力强迫至关重要。单点廓线无法捕捉这些水平尺度的触发机制。这可能是模型在3小时预报后性能下降较快的原因之一——对于由远距离系统移动造成的对流，单点热力信息的预见期有限。
动力信息的缺失：当前模型只嵌入了热力能量（CAPE）信息，而完全忽略了风场、垂直风切变、抬升触发机制等动力条件。在气象学中，CAPE代表“燃料”，动力抬升代表“点火器”。没有点火器，燃料再多也可能不爆发。如何将风场、散度、涡度等动力信息，特别是高时空分辨率的雷达风廓线或卫星导风数据，有效地嵌入模型，是下一步的重点。
泛化能力：模型在青岛和杭州两个沿海站点表现良好，但其在内陆、高原、不同气候带下的泛化能力尚未经过充分检验。大气的热力、动力过程在不同地理环境下差异巨大，需要收集更多样化的数据进行训练和测试。

未来工作的几个方向：

迈向三维：尝试融合多站点的廓线观测，或引入数值模式输出的三维温湿场分析资料，让模型获得水平方向的热力梯度信息。
嵌入动力过程：研究如何将质量连续方程、涡度方程等简化的动力约束，或者将雷达反演的低层风场辐合信息，以可微分的形式嵌入网络。
自适应融合：探索更智能的多源数据融合策略，例如使用注意力机制让模型动态决定在预报的不同阶段、针对不同的天气形势，应该更信赖热力信息还是动力信息、卫星信息还是雷达信息。
可解释性深化：利用梯度加权类激活图等可视化技术，分析模型在做出预报决策时，具体关注了卫星图像的哪些区域、廓线的哪些层次，从而与预报员的经验知识进行对照和互证。

这个项目给我的最深体会是，在AI for Science，尤其是气象预报这样的强物理约束领域，纯粹的“端到端”黑箱模型可能很快会遇到天花板。将领域知识（物理方程、经验规则）以一种灵活、可学习的方式“编织”进深度学习模型的架构中，创造出一种“物理引导的深度学习”范式，是突破当前瓶颈、构建更可靠、更可解释、泛化能力更强的新一代智能预报模型的关键路径。这条路充满挑战，但也正因为如此，每一次微小的进展都让人倍感兴奋。希望我们的这次尝试，能为同行们提供一些有价值的参考。

查看全文

http://www.jsqmd.com/news/891821/