当前位置: 首页 > news >正文

(ICLR26) Task-Adaptive Parameter-Efficient Fine-Tuning for Weather Foundation Models

这篇论文聚焦天气基础模型(WFMs)的参数高效微调问题,提出了首个针对气象任务特性的 WeatherPEFT 框架,核心是在少量可训练参数下实现与全微调相当的性能。

1、研究动机

WFMs 的优势与挑战:天气基础模型通过大规模预训练获得强泛化能力,但模型规模扩大(达数十亿参数)导致全微调的计算和存储成本过高,难以落地。

现有 PEFT 方法的局限:自然语言处理和计算机视觉领域的 Parameter-Efficient Fine-Tuning (PEFT) 方法(如 LoRA、DoRA)无法适配气象下游任务的特殊性 —— 变量异质性(如温度、湿度)、分辨率多样性(如 0.25°~5.625°)、时空覆盖差异(全球 vs 区域),导致性能不佳。


2、整体框架

作者提出了 WeatherPEFT——一种面向天气基础模型(WFMs)的新型参数高效微调(PEFT)框架。如下图所示,包含两个核心模块:任务自适应动态提示(TADP)随机费雪引导自适应选择(SFAS)。其中,TADP 通过适配模型的前向传播过程以匹配任务专属特性,SFAS 则在反向传播阶段主导后续的参数更新。

数据输入embedding layer 得到4维张量 E ,各维度分别表示:D是隐藏维度(hidden dimension),存储气象特征的抽象表征;V是物理变量数,如温度、湿度、风速等;Ph×Pw:是空间尺寸,对应数据的分辨率与空间覆盖范围(如 Ph=32, Pw=64 代表 32×64 的网格精度)。首先将 E 输入 TADP 模块处理。

任务自适应动态提示(TADP),包括两个步骤

  • 内部模式提取:用三个适配器(HW-Adapter、V-Adapter、D-Adapter)分别在三个维度进行微调
  • 外部模式整合:合并V,Ph,Pw,通过自注意力机制建模物理变量与空间分辨率的耦合关系,生成 soft prompt token

随机费雪引导自适应选择(SFAS):气象下游任务差异极大(如全球降尺度 vs 区域降水预报),模型中不同参数的重要性的天差地别。比如负责 “空间关系建模” 的参数对降尺度任务至关重要,但对区域降水预报可能作用有限。SFAS 的核心目标是在保留大模型气象知识的前提下,精准筛选并更新对当前气象任务最关键的少量参数,避免 “全参数微调” 的高成本和 “通用 PEFT” 的适配性差问题。 SFAS包括三个部分:

  • 用费雪信息矩阵量化参数重要性。费雪信息矩阵(Fisher Information Matrix)是衡量 “参数微小变化对模型输出影响程度” 的指标 —— 参数对任务的影响越大,其对应的费雪信息值越高,说明该参数是任务关键参数。SFAS 采用对角矩阵近似,避免计算量爆炸,仅需量化每个参数的独立重要性(如温度变量对应的参数、某一分辨率对应的空间参数)。通过模型预测分布与真实标签的对数似然梯度计算,近似得到每个参数的费雪信息值(公式见Eq.6-7),值越高的参数越优先被选择更新。

  • 退火随机成分稳定选择过程。微调初期,模型参数可能受数据噪声影响,导致部分高费雪信息值的参数是 “伪关键参数”(仅适配噪声,而非任务本质),直接按费雪值筛选会导致过拟合或性能波动。因此,引入随训练进程线性衰减的随机向量(公式见 Eq.8)。训练初期(随机成分权重高):给参数重要性值加入少量随机扰动,避免过度聚焦于初期噪声相关参数;训练后期(随机成分权重趋近于 0):逐渐依赖真实费雪信息值,精准锁定任务核心参数。这个步骤通过平衡 “参数选择的准确性” 与 “训练稳定性”,尤其适配气象数据中极端事件(如暴雨、寒潮)的稀疏性带来的噪声问题。

  • 自适应参数子集筛选与更新。根据 “费雪信息值 + 随机扰动后的综合得分”,选择 Top-k 比例的参数(k 为超参数,可设为 0.1%~4%)组成 “任务专属可训练参数子集”,其余参数冻结(保留大模型的通用气象知识)。仅对筛选出的子集参数进行梯度下降更新,无需调整整个模型的数十亿参数 —— 例如在 Aurora(1.3B 参数)模型上,k=0.1% 时仅需更新 1.3M 参数,大幅降低计算和存储成本。


3、实验结果

实验设置:基于 Aurora(1.3B 参数)和 Prithvi-WxC(2.3B 参数)两个气象大模型,在三个典型气象任务上测试:全球降尺度、集合预报后处理、区域降水预报。

核心结果

  1. 降尺度任务:仅用 3.48M 可训练参数(占模型总量 0.28%),RMSE 指标优于所有现有 PEFT 方法,接近全微调(1239.94M 参数)。
  2. 集合预报后处理:3.18M 参数实现与全微调相当的 CRPS 分数,Z500 变量上甚至超越全微调。
  3. 区域降水预报:52.37M 参数(占模型 4%)在 SEEPS、ACC 指标上超过全微调,精准捕捉强降水的局部化特征。

**消融实验:**TADP 和 SFAS 单独使用均有效,协同后性能最优;SFAS 的随机成分可降低参数选择波动,TADP 的内外模式提取对适配异质数据至关重要。

http://www.jsqmd.com/news/345215/

相关文章:

  • 2026年热门的耐腐蚀反应釜/哈氏合金反应釜优质供应商推荐参考 - 行业平台推荐
  • 2026更新版!AI论文写作软件 千笔AI VS 云笔AI,MBA专属写作神器!
  • No145:AI中国故事-对话王弼——玄学智慧与AI理解:以无为本、得意忘言与本质把握
  • 新能源汽车出保后维修哪家可靠?2026年维修公司推荐与评价,直击配件贵与检测不精准核心痛点 - 品牌推荐
  • 2026年新能源汽车检测机构推荐:多场景实测评价,解决安全与估值核心痛点 - 品牌推荐
  • 阿里开源Qwen3-Coder-Next,80B参数仅激活3B的MoE顶尖编程助手
  • 导师严选8个降AIGC平台 千笔AI解决AI率过高难题
  • Win狂喜!国产Cowork和Codex App,昆仑万维Skywork桌面版发布
  • 自制飞思卡尔智能车 DRV8701 双路驱动 PCB 分享
  • Python爬虫实战:基于异步技术与数据挖掘的图书销量排行榜监控系统
  • 百度免费上传组件如何处理大文件分段的方案总结?
  • 手把手玩转双向CLLC双闭环设计
  • 西门子PLC1500大型程序fanuc机器人汽车焊装 包括1台西门子1500PLC程序
  • 网页中如何实现大文件夹整体上传的解决方案总结?
  • 如何选择可靠的新能源维修公司?2026年推荐与深度评测,直击效率低下与兼容性差痛点 - 品牌推荐
  • 房屋租赁系统 二手房屋销售系统 开题报告 springboot和vue
  • vue-cli项目中如何处理大文件秒传的方案总结?
  • 2026年质量好的水帘框/四川水帘纸高性价比推荐 - 行业平台推荐
  • 2026年新能源汽车维修公司推荐:聚焦城市通勤与长途场景,严选服务商并发布避坑指南 - 品牌推荐
  • 百度WebUploader上传超大附件有哪些解决方案总结?
  • 科研党收藏!千笔ai写作,专科生论文神器
  • 从 状态管理 V1 到 V2:鸿蒙开发者的进化指南
  • 2026年新能源汽车维修公司推荐:多场景维保需求深度评测,破解技术壁垒与配件痛点 - 品牌推荐
  • 2026年海外GEO优化推广服务商权威测评--深圳昊客网络GEO技术携AI算法脱颖而出 - 深圳昊客网络
  • 2026年医院展馆迎宾讲解机器人深度技术解析与主流产品评测 - 智造出海
  • 有实力的信息流广告品牌企业哪家好,广西企业全梳理 - 工业推荐榜
  • 详细介绍:ReentrantLock 加锁与解锁流程详解(源码分析,小白易懂)
  • 2026年可靠的钢结构球形支座生产商推荐,好用的品牌有哪些 - mypinpai
  • 新能源汽车维修哪家技术强?2026年维修公司排名推荐,直击检测精度与安全痛点 - 品牌推荐
  • 2026年洗发水厂家年度排名大梳理,靠谱品牌选购指南 - myqiye