当前位置: 首页 > news >正文

ICLR 2026 Oral | 西湖大学发布Real PDE Bench

复杂物理系统的时空演化预测是科学与工程领域长期关注的核心问题,典型场景涵盖流体力学、燃烧与可控核聚变等多类多尺度复杂动力学系统。近年来,科学机器学习(Scientific ML)在神经算子、物理约束学习与大模型预训练等方向快速发展,为高维、强非线性、非定常系统的高效准确建模开辟了新的范式。然而,一个关键瓶颈逐渐凸显出来:目前多数AI模型主要在数值仿真数据上训练与验证,而真实世界的实验观测数据昂贵、稀缺且无法构成体系,我们难以评估这些模型在真实世界的测量数据上究竟表现如何。

现实与仿真之间存在较大的差距,在现实中测量,常常会受传感器噪声干扰、观测数据不完整或者实验环境不稳定等因素的影响。而仿真数据虽然能提供更全的变量和更密的参数覆盖,但是却无法避免数值离散带来的误差、理想化的边界条件,以及因简化物理过程而产生的偏差。正因为如此,当前AI for Physics领域急需一个能同时包含真实测量数据与配对仿真数据的标准基准框架。这样的基准可以帮助AI for PDE的研究更系统地评估模型在实际测量场景下的性能,进而探究“Sim-to-Real”的迁移难题,从而为Scientific ML在真实世界中的部署和落地提供更可靠的评估依据。

基于这一动机,西湖大学吴泰霖实验室,联合西湖大学范迪夏实验室,以及上海交大周德智实验室,提出了RealPDEBench。这是首个同时包含真实世界测量数据与配对数值仿真数据的机器学习基准框架。该基准由五个物理场景的数据集、三类任务、九个评估指标以及十个代表性基线方法构成,覆盖了流体、燃烧等多个不同的复杂物理系统。它提供了一个统一、模块化的代码框架,以便快速复现实验和开展扩展性的研究。

五种物理场景:从经典流动到燃烧多物理场

RealPDEBench构建了五个具有代表性的复杂物理系统场景,采集了多种工况下的真实实验测量数据,计算了对应的CFD仿真数据,旨在覆盖从基础流动到强耦合、多尺度、多物理过程的一系列关键挑战。最终,本文提供了包含736条真实&仿真配对轨迹的数据集,每条轨迹记录了系统参数(如雷诺数、控制频率、当量比等)及其系统状态。五种物理系统包括:

  • Cylinder:圆柱绕流的层流到湍流的过渡与卡门涡街的形成,是流体动力学的经典非定常基准;

  • Controlled Cylinder:在圆柱绕流基础上引入外部周期性控制(振动幅值与频率),构成了“控制响应预测”的挑战;

  • FSI(流固耦合):圆柱在漩涡流体作用下产生非线性涡激振动,涉及流体力与结构动力学的强耦合与锁定现象;

  • Foil:由三维实验/仿真提取的剖面数据,体现三维效应带来的小尺度涡结构与湍流的复杂性;

  • Combustion:三维旋流燃烧(氨气/甲烷/空气)的实验与仿真数据,涉及反应流、多场耦合与多尺度动力学。

在真实测量数据的采集中,流体的数据通过循环水槽结合PIV(粒子图像测速)获取速度场;燃烧数据则通过OH*化学发光成像获取火焰光强等表征量。与之配对的仿真数据使用CFD(大涡模拟)在匹配参数设置下生成,从而形成相同工况的实验与仿真对照。

经过我们的观察,意识到仿真数据与真实测量数据呈现出不同的误差特性,真实数据主要受到传感器噪声影响,而仿真数据的误差则主要由数值误差与建模误差主导。其中,仿真数据具有独特优势,其获取成本更低、可提供更多观测模态(物理变量),并且不受测量噪声的直接影响,而真实数据则反映出了物理系统外在表现的状态,是物理系统真实变化的体现。

三类任务设置:以真实世界评测为核心的Sim-to-Real研究

为了在统一框架下比较真实测量与仿真数据的训练效果,RealPDEBench定义了三类预测任务,并明确:所有模型最终都在真实数据测试集上进行评估,以贴近实际部署的目的,三类任务包括:

  1. 仅使用仿真数据训练(Simulated Training):模型在仿真数据上训练,直接在真实数据上测试;

  2. 仅使用真实数据训练(Real-world Training):模型只用有限真实样本训练;

  3. 仿真数据预训练+真实数据微调(Simulated Pretraining+Real-world Finetuning):先利用大量仿真数据预训练,再用少量真实数据微调。

这一设计不仅将“Sim-to-Real”定义为可量化与可复现的基准任务,也为研究“如何融合仿真优势与真实可靠性”提供了简洁可用的实验平台。

通过三类任务结果的对比发现,首先,仅使用真实数据训练的模型相较于仅使用仿真数据训练的模型具有明显优势,其相对L2误差减小了9.39%至78.91%,说明仅使用仿真数据训练无法准确捕捉实际场景中的复杂特性。其次,以仿真预训练初始化模型参数并在真实数据上微调的模型,其误差低于仅使用真实数据从头训练的模型,表明仿真数据作为预训练数据对于模型性能的提升是有帮助的。此外,仿真预训练还能加速真实数据训练过程中的收敛,微调模型用更少的训练更新即可达到相同或更优的性能,而且训练过程中RMSE损失下降更快。

九个评估指标与十个基线模型:同时衡量数据像素误差与物理一致性

RealPDEBench不仅采用了RMSE、MAE、相对L2误差、R2等常见数据误差指标,还引入了面向物理一致性的度量,例如频域误差(Fourier Space Error)、周期性相关的Frequency Error、以及速度剖面等长期统计量(MVPE)。除此之外,针对“sim-to-real”的问题,论文还设计了更新比例(Update Ratio)用于刻画“仿真预训练 + 真实微调”相对“从真实数据直接训练”的收敛效率与准确度优势。

基线模型方面,论文覆盖九类深度学习模型与一个降阶模型(DMD),包括 U-Net、FNO、DeepONet、MWT、GK-Transformer、Transolver,以及预训练foundation model(DPOT)等,形成从传统经典模型到大模型预训练方案的系统对照。

经过系统性的实验,本文发现不同模型架构在各类评测指标上呈现出不同的权衡,基于卷积的模型在逐像素计算的RMSE上表现精度更高,而基于算子学习与谱域的方法更能保留周期性与全局物理特征。此外,自回归的长时序评估也体现了误差累积差异,部分模型在短期预测中表现良好,但在多步 rollout 中误差会逐步累积;相比之下,大规模预训练模型(如DPOT)能够保持更稳定的长时序预测性能。

面向可落地的科学机器学习

AI for Physics这一研究领域,长期以来都面临着“理论上看着有用,实际落地却难上加难”的困境。导致这个困境的核心原因是仿真数据和真实场景的脱节。在做仿真时,无法避免地要做一些理想化简化,比如忽略复杂未知的噪声、固定简化边界条件,或是把物理间的耦合关系简化处理,但在真实的工业生产、实际场景中,物理系统的问题会更加复杂:多源噪声无处不在,边界条件可能随时突变,还常常伴随着多尺度多物理场耦合的情况。

所以本文认为,未来的研究方向,必须从“单纯追求仿真场景下的精度提升” 转变为“搭建仿真与真实数据之间的桥梁”。这不仅仅是算法的调整,更是从“拟合那些理想化的方程”到“真正解决实际问题”的本质跨越。而RealPDEBench最有价值的地方,就是通过“真实数据和仿真数据配对”的机制,给解决这个核心矛盾提供了关键支撑和平台。

原文下载:

https://iclr.cc/virtual/2026/poster/10006599

公众号原文链接(文末附论文资源):

https://mp.weixin.qq.com/s/ts04bhA57l8V-9CzR4ruRw

注:文章由原作者投稿分享,向本公众号授权发布。

更多精彩内容,敬请关注微信公众号“力学与人工智能”!

http://www.jsqmd.com/news/432618/

相关文章:

  • 构建生产级Agent核心概念教程(非常详细),AI Agent技术栈深度剖析,收藏这一篇就够了!
  • Infoseek字节探索媒介投放实战:技术赋能精准投放,基于热门案例的代码化落地
  • 2026异丙醇市场风向标:这些厂商值得一看,洗车水/二氯甲烷/ECS/120#白电油/四甲苯,异丙醇源头厂家怎么选择 - 品牌推荐师
  • 搜索逻辑范式转移:推荐一家深耕生成式引擎优化(GEO)的专业团队 - 品牌2026
  • 内网配置pip - yi
  • 呼吸
  • 省钱兄科技无人自助系统:智能算法驱动下的高效省钱新方案
  • 深度解析省钱兄科技:无人自助系统背后的省钱黑科技
  • 512G EMMC擦写时间比较长问题 - M
  • 你的听力,该好好保护了!这些护耳知识一定要知道!
  • Fastadmin中使用Redis
  • 国际爱耳日如何爱耳?在喧嚣的世界里,给耳朵带来一份“安静”的爱
  • 从工具到伙伴:深度解析AI智能体如何重塑传统行业格局
  • A Space
  • 2 月刊|GPM 2.0错误日志分析上线,PC端监测能力全维度突破
  • 2026全球圆锥粉料清理筛市场:原粮初清装备稳健增长与产业应用前景
  • 设备管理要点:易点易动助力企业数字化转型
  • 西门子Smart 200 PLC与Smart 700触摸屏实现的定长切割与跟随切割功能:稳定运...
  • 2026年军队文职选岗培训机构推荐:优秀口碑好的军队文职头部机构 - 野榜精选
  • 洛谷P1593 因子和 题解
  • AI Agent 完全指南:2026 年核心概念、主流框架、开发实践与选型建议
  • 植物大战僵尸杂交版下载:全网最详细的安装教程,手机电脑都能玩(附下载地址) - xiema
  • 【每天学习一点算法 2026/03/03】递增的三元子序列
  • 谭蔚泓院士高分文章汇总(2025-2026)
  • (开源项目)当我用Codex修复本科做的双创项目...研梦:基于Django+Vue的考研信息化平台(论坛发帖、新闻资讯、爬虫趋势)
  • 今年准备看AI方向的机会?这份《大模型与Agent面试宝典》建议收藏
  • 选择WMS仓储管理系统供应商时,需要考察哪些关键因素?
  • vue3中台框架解析
  • 2026年度无管道单向流新风系统品牌TOP10榜单:技术创新与场景适配性双维度评选 - 野榜精选
  • 2026年河北滚齿机厂家实力榜:六轴数控滚齿机、四轴数控滚齿机、五轴数控滚齿机、大型数控滚齿机、卧式滚齿机、大模数滚齿机、五家企业凭技术与口碑出圈 - 海棠依旧大