当前位置：首页 > news >正文

《TAML》好文推荐 | 来自中国科学院力学研究所张磊博士评估大语言模型在计算流体力学领域的知识利用、学习与创造

news 2026/7/12 10:42:58

以下内容转载自微信公众号“TAML力学快报英文”

原文链接：https://mp.weixin.qq.com/s/AOCjm7fiV3RQTzmOlWObjg

Theoretical and Applied Mechanics Letters

大语言模型的快速发展引起了广泛关注，尤其在科学计算领域。计算流体力学问题复杂多样，既有成熟数值方法可解决的常规问题，也有需新方法或创新突破的难题。本研究聚焦于评估推理型模型(DeepSeek R1和OpenAI o3-mini-high)和非推理型模型(DeepSeek V3和ChatGPT 4o)在计算流体力学领域的三种能力：利用知识、学习知识和创造知识。

图片来自 Elsevier

研究亮点

本文提出三类基准问题，用于系统评估大语言模型（LLM）在计算流体力学（CFD）中对知识的利用、学习与创造能力。具体包括：

传统计算流体力学问题，可利用大语言模型知识中已有数值方法求解，如顶盖驱动方腔流动与Sod激波管问题。
需引入新方法求解的问题，例如求解奇异摄动对流-扩散方程所需的钱氏物理信息神经网络（Chien-PINN）。
需方法创新的难题，如病态的Hilbert线性代数方程组，经典方法无法有效求解。

评估结果表明，推理型模型在CFD问题求解中明显优于非推理型模型，展现出较强的专业适应性。然而，其在自主探索与方法创新方面仍存在明显局限。

研究进展

本研究通过三类基准问题，对比了推理型和非推理型大语言模型的三种能力:

(1)利用已有知识的能力: 要求大语言模型求解CFD中经典的顶盖驱动方腔流动和Sod激波管问题。推理型模型能够给出有效的解，非推理型却无法给出可运行的程序。

(2)学习新知识的能力：要求大语言模型学习新近提出的Chien-PINN方法并求解边界层型奇异摄动问题。推理型和非推理型大语言模型都能给出Chien-PINN的可运行程序，但是只有DeepSeek R1给出了接近参考解的结果，其它模型的结果与参考解相差明显。这是因为DeepSeek R1正确地设置了边界层的位置和厚度，OpenAI o3-mini-high只正确地设置了边界层的位置，而非推理模型无法正确地设置这两种参数。

(3)创造新知识的能力：要求大语言模型尝试求解病态的Hilbert线性代数方程组。所有模型均无法有效求解该问题。其中，DeepSeek R1的思考过程指出了经典方法失效的原因并估计了高阶Hilbert矩阵的条件数的量级，探讨了可能的解决策略，但是遗憾的是并没有使用这些策略。

研究结论

本研究通过三类CFD问题评估大语言模型的科学计算能力。

(1) 推理型模型（DeepSeek R1和OpenAI o3-mini-high）在经典CFD问题（如顶盖驱动方腔流动、Sod激波管问题）中显著优于非推理型模型（DeepSeek V3和ChatGPT 4o），能生成有效求解代码，而非推理模型的代码常产生致命错误。

(2) 对于需学习新方法求解的问题（如使用Chien-PINN求解边界层型奇异摄动对流-扩散方程），推理模型通过分析方程准确设置边界层参数，将相对L2范数误差控制在2%以内，远超非推理模型50%的误差水平。

(3) 然而，面对高度病态的Hilbert线性代数方程组，所有模型均无法有效求解，但DeepSeek R1能深入分析Hilbert矩阵的条件数并探索可能的改进方案，为研究者提供新思路。

研究结果显示，相较于非推理型模型，推理型大语言模型在知识的利用、学习及创新方面更具潜力，但其自主探索知识的能力仍有待进一步提升。

视频导读

全文下载：

Evaluations of Large Language Models in Computational Fluid Dynamics: Leveraging, Learning and Creating Knowledge

Long Wang , Lei Zhang, Guowei He

https://www.sciencedirect.com/science/article/pii/S2095034925000297

BibTex:

@article{WANG2025100597,

title = {Evaluations of Large Language Models in Computational Fluid Dynamics: Leveraging, Learning and Creating Knowledge},

journal = {Theoretical and Applied Mechanics Letters},

pages = {100597},

year = {2025},

issn = {2095-0349},

doi = {https://doi.org/10.1016/j.taml.2025.100597},

url = {https://www.sciencedirect.com/science/article/pii/S2095034925000297},

author = {Long Wang and Lei Zhang and Guowei He},}

作者介绍

王笼，第一作者，中国科学院力学研究所博士研究生。2022年本科毕业于西北工业大学数学与统计学院。

张磊，共同通讯作者，中国科学院力学研究所特别研究助理。博士毕业于北京大学，获2021年北京大学优秀博士学位论文。主持了国家自然科学基金青年基金项目。他的研究领域为计算力学，数据驱动的有限元和量纲学习方法。

何国威，共同通讯作者，中国科学院院士，中国科学院力学研究所研究员。研究领域为湍流，计算流体力学和机器学习。

http://www.jsqmd.com/news/344432/

相关文章：

深入解析：MySQL——增删改查操作

空间智能 (Spatial Intelligence)

springboot基于Java的仓库管理系统（源码+文档+运行视频+讲解视频）

基于 Starlight 文档站点接入 Microsoft Clarity 的完整实践指南

建筑资质专业代办公司价格差异大天津广运达性价比高吗 - 工业设备

2026年专业的喷绘喷印,写真喷印厂家实力推荐名录 - 品牌鉴赏师

2026年阿里云Openclaw（clawdbot）秒级部署步骤

‌碳信用计算工具：测试从业者如何用MLOps破解碳排放核算与交易‌

横评后发现!王者级的一键生成论文工具 —— 千笔ai写作

2026年回收手机价钱多少，哪种渠道更划算？ - 京回收小程序

2026灌流器厂家排名及发展趋势解析 - 品牌2025

springboot基于Java的茶叶销售商城系统（源码+文档+运行视频+讲解视频）

深度测评9个降AI率网站，千笔·专业降AI率智能体解决论文AIGC检测难题

肾病领域灌流器详解及相关厂家介绍 - 品牌2025

springboot基于java的餐厅美食信息管理系统（源码+文档+运行视频+讲解视频）

[Linux]学习笔记系列 -- [drivers][mmc]mmc_sd

腾讯云Lighthouse 一键部署 OpenClaw 转化为专属股市分析师实战教程

Linux 系统定期更新硬件时钟（RTC）

解决ORA-28002: the password will expire within 7 days

解决程序连不上RabbitMQ：Attempting to connect to/access to vhost虚拟主机挂了的排错与恢复

2026肝衰竭人工肝耗材优选健帆生物 - 品牌2025

江西化学制品企业 EcoVadis 铜牌认证成功案例 —— 奋飞咨询助力可持续发展跃升 - 奋飞咨询ecovadis

说说全国金红石钛白粉市场份额高的厂家，哪家更值得选？ - 工业设备

六度人脉视域下信息价值传递的创新路径——基于AI智能名片链动2+1模式小程序的实践研究

2026年全国好用的毛绒品牌推荐，蠡县永盛毛绒有限公司 - 工业品网

聊聊摇粒绒源头工厂，哪家售后好且性价比高 - mypinpai

健帆血液灌流器在尿毒症治疗中的应用解析：适应证与临床价值 - 品牌2025

学长亲荐！风靡全网的AI论文工具 —— 千笔·专业学术智能体

2026年血液净化耗材选购指南：灌流器品牌深度解析 - 品牌2025