当前位置: 首页 > news >正文

用Attention和MoE预报天气,刷新公里级预测SOTA|CVPR‘26 Highlight

STCast团队 投稿
量子位 | 公众号 QbitAI

近日,计算机视觉领域顶级国际会议CVPR 2026公布了论文录用结果。本次会议共收到16,092篇投稿,最终录用4,090篇,整体录用率为25.42%,其中仅有约2.5%的论文被评为Highlight Paper

由香港科技大学郭嵩院士(IEEE Fellow)团队与上海AI实验室合作完成的论文《STCast: Adaptive Boundary Alignment for Global and Regional Weather Forecasting》成功入选CVPR 2026 Highlight Paper。

该工作提出了一种全新的时空天气预报框架STCast,通过自适应边界对齐和时间混合专家模型,在全球预报、区域预报、台风路径预测和集合预报四大任务上全面超越现有方法,取得了SOTA性能

研究背景与动机

准确的公里级区域天气预报是一项具有深远社会经济影响的重大科学挑战。现有的区域预报策略主要分为两类:

  1. 训练专用区域模型

    忽略了对准确预报至关重要的跨区域依赖关系

  2. 从全球预报中裁剪区域

    受限于静态且不精确的区域边界,泛化能力差

传统数值天气预报(NWP)方法通过求解偏微分方程来处理边界问题,但计算成本极高。而现有的AI方法通常只使用相邻区域来定义边界,这与成熟的”大气-海洋-陆地-生物圈耦合理论”相矛盾——该理论表明,区域大气中的任何一点都受到整个地球系统的影响。例如,西伯利亚的寒潮可以引发东亚的寒潮,青藏高原的地表加热可以同时改变东亚季风和北美急流。

为了解决这些挑战,团队提出了STCast框架,它明确地模拟了地球系统中不断演变的全球-区域相关性

三种区域预报策略对比

团队对比了三种主流的区域天气预报策略:


上图中,图(1)是三种区域预报策略示意图:
(a) 现有AI方法:从全球预报中裁剪相邻区域,与区域变量一起进行预报;
(b) 从头直接训练:仅使用目标区域的数据训练模型;
(c) 团队的方法(STCast):通过分布密集连接全球-区域模型进行预报。

图(2)是三种策略的区域预报性能对比。

定量结果表明,STCast在所有变量的平均RMSE和ACC上都取得了最佳性能,显著优于直接训练和OneForecast方法。这验证了团队的动态、地球感知边界机制优于基于静态邻居的耦合方法。

STCast整体架构

STCast是一个统一的时空天气预报框架,能够同时处理四大关键任务:

图2:STCast整体架构图

(a) 低分辨率全球预报:包含编码器、处理器和解码器,集成了Temporal MoE模块;
(b) 高分辨率区域预报:通过Spatial-Aligned Attention模块融合全球和区域信息;
(c) 台风路径预测:利用预测的高分辨率MSL来推断台风路径;
(d) 长期预报和集合预报:通过注入Perlin噪声生成多个预报集合。

STCast的核心创新在于两个关键模块:Spatial-Aligned Attention (SAA)Temporal Mixture-of-Experts (TMoE)

核心创新一:Spatial-Aligned Attention (SAA)

Spatial-Aligned Attention模块将全局特征作为Query和Key,将区域特征作为Value,通过线性交叉注意力动态耦合全球和区域特征。

图3:Spatial-Aligned Attention示意图

SAA的关键机制包括:

  • 大圆距离度量

    更准确地测量地球表面上的空间关系

  • 指数距离衰减函数

    初始化可学习的全球-区域分布,确保远距离区域的影响较弱

  • 高效注意力机制

    将计算复杂度从O(n²)降低到O(n)

通过这种方式,SAA建立了一个最优的全球-区域分布,该分布在训练过程中不断优化,能够捕捉全球和区域大气模式之间的潜在相关性。

核心创新二:Temporal Mixture-of-Experts (TMoE)

考虑到大气变量在不同月份存在显著差异,Temporal Mixture-of-Experts将每个月的预报视为相对独立的任务,并使用混合专家模型来组织这些任务。

图4:Temporal Mixture-of-Experts示意图

TMoE的关键机制包括:

  • 离散高斯分布

    为每个月学习一个高斯分布来表示其时间特征

  • 旋转对齐

    将月份序列旋转对齐到输入变量,确保激活概率随时间距离单调递减

  • 多专家激活

    增强路由多样性,防止专家同质化

实验结果

1. 低分辨率全球预报

团队在ERA5数据集上评估了STCast的全球预报性能,与Pangu-Weather、Graphcast、Fuxi和OneForecast等主流方法进行了对比。

表1:全球天气预报性能对比

结果表明,STCast在所有基准测试中都表现出一致的优越性,特别是在长期预测方面取得了显著的提升。这得益于团队的月份特定训练策略,它能够有效地捕捉大气系统中的季节依赖和月际变化。

2. 高分辨率区域预报

图5:东亚区域的高分辨率预报实验:直接训练、OneForecast和STCast方法对比

在东亚区域的高分辨率预报实验中,团队对比了直接训练、OneForecast和STCast三种方法。结果显示,实现动态边界条件的STCast相比直接训练的STCast(无动态边界)和OneForecast,RMSE降低了0.05,ACC提高了0.1。

3. 极端事件评估:台风路径预测

团队评估了STCast在两个近期台风事件上的表现:2024年5月的台风艾云尼(Ewiniar)和2024年11月的台风银杏(Yinxing)

图6:台风路径预测结果

结果显示,STCast的72小时路径预报与观测路径的吻合度明显高于ECMWF、FourCastNet、Pangu-Weather和FengWu。特别是在台风银杏的长期预测中,STCast的平均误差仅为96.5公里,而次优的Pangu-Weather为160公里。

消融研究

团队进行了全面的消融研究来验证每个模块的有效性:

表2:消融研究结果

结果表明,移除任何组件都会导致区域和全球任务的性能下降。最显著的下降发生在移除全球-区域分布(区域任务:10天RMSE增加0.22)和月份嵌入(全球任务:10天RMSE增加0.13)时,这证实了每个组件在提升STCast整体有效性方面的关键作用。

结论

在这项工作中,团队在Spatial-Aligned Attention模块中引入了自适应注意力图,为区域预报提供动态边界条件。除了区域任务外,团队还将Temporal Mixture-of-Experts嵌入到时空预报框架STCast中,将天气预报视为一个多任务问题,并将月度子任务委托给专门的专家。

因此,STCast同时解决了四个不同的挑战:低分辨率全球预报、高分辨率区域预报、极端事件评估和集合天气预报。实验和消融研究证实,STCast在所有评估场景中都始终优于竞争方法。

论文链接:https://arxiv.org/pdf/2509.25210v3
代码仓库:https://github.com/chenhao-zju/STCast

http://www.jsqmd.com/news/791658/

相关文章:

  • SpringMVC01:入门案例搭建(含三层架构、MVC 详解与完整代码)
  • 如何彻底移除Windows Defender:3种模式性能优化终极指南
  • AI教材写作必备!低查重AI工具,一键生成20万字教材无压力!
  • 20253916 2025-2026-2 《网络攻防实践》实践8报告
  • 苏州网站建设公司选型指南:10家实力服务商深度评测 - 速递信息
  • ggml 架构总览:一个 107KB 头文件背后的纯 C 张量计算引擎
  • PyWxDump微信数据解析工具:3步快速备份聊天记录的完整指南
  • 鸣潮智能游戏助手:3步搞定自动化战斗,解放双手轻松游戏
  • DamaiHelper:零基础也能掌握的智能抢票终极解决方案
  • 从Nginx到APISIX:一个后端开发者的微服务网关迁移实战(含Docker部署避坑)
  • 无锡网站建设公司选型指南:10家实力服务商优势对比(含GEO与选型站) - 速递信息
  • 如何三分钟永久解锁科学文库加密PDF?ScienceDecrypting工具使用全攻略
  • PlanAndSolveAgent
  • 高效解决OFD文件兼容性问题:Ofd2Pdf免费开源转换工具完全指南
  • SITS2026千人会场无线漫游卡顿真相(2026年最新802.11ax+Wi-Fi 7协同调度实测报告)
  • 2026年无锡网站建设公司选型指南:10家优秀网站制作服务商横向对比 - 速递信息
  • 2026年降AI工具知网专项实测:五款主流工具知网AIGC检测通过率完整横评分析报告
  • 告别/deep/和::v-deep:在Vue项目中更优雅地管理组件样式的几种现代方案
  • 为什么我们做的不是普通白板,而是 AI 可视化思考工作台?
  • 探索罗技PUBG压枪宏:从技术原理到实战配置的进阶指南
  • 3分钟解锁B站评论区智能识别:开源成分检测器让用户画像一目了然
  • Umi-OCR实战指南:5大高效方案搞定图片文字识别难题
  • 解析2026年三星SDI化学价格趋势与一级代理市场定位优势
  • 3个技巧让NoFences重塑你的Windows桌面工作流
  • 思源宋体7种字重免费商用字体:从零开始打造专业中文排版系统
  • 112.Ultralytics YOLOv8实战,从数据集准备到TensorRT加速
  • Python开发者快速接入Taotoken并调用多模型指南
  • AIGC检测标准升级后降AI策略解读:2026年高校检测收严后完整免费应对方案分析
  • 如何用Fast-GitHub让GitHub下载速度提升10倍:终极加速指南
  • 如何3步搞定QQ音乐、网易云音乐加密文件,让你的音乐真正属于你