当前位置：首页 > news >正文

“AI大语言模型”助力大气科学相关交叉领域实践技术应用

news 2026/6/13 1:44:26

专题一：预备知识
1.大语言模型在大气科学中的常见应用场景

ChatGPT是一种基于自然语言处理的技术，因此在大气科学领域应用主要集中在文本处理和语言生成方面。例如：

1.1 辅助数据分析：ChatGPT 可以帮助理解和解释大量的气象数据内在信息。

1.2自然语言处理：用于分析和解释历史气象记录、研究论文或报告，提取关键信息和趋势

1.3 文献搜索和综述：ChatGPT 可以撰写文献综述，同时快速查找和总结相关研究及论文

1.4 论文撰写辅助：辅助撰写科研论文，提供文本编辑和改进建议

1.5 专业咨询：ChatGPT提供有关特定研究技术方法的专业建议。

1.6 教学工具：ChatGPT 可以帮助学生理解复杂的大气概念和编程相关问题

2.大语言模型常见平台使用方法

2.1 POE使用方法

2.2 ChatGPT使用方法

3.提示词工程

3.1 提示词工程介绍

3.2 提示词工程讲解

3.3 提示词常见模板

4.Python简明教程

4.1 Python基本语法

4.2 Numpy使用

4.3 Pandas使用

4.4 Xarray使用

4.5 Matplotlib使用

专题二：科研辅助专题

1.GPT作为科研工具

1.1把GPT当作搜索引擎

1.2把GPT当作翻译软件

1.3把GPT当作润色工具

1.4用GPT提取整理文章数据

1.5用GPT数据处理

2.GPT作为科研助手生成

2.1用GPT分析结果

2.2用GPT总结生成论文摘要

2.3用GPT总结生成文献综述

2.4用GPT分析论文技术方法

2.5用GPT分析代码

2.6用GPT分析论文公式

2.7用GPT识别图片并分析

2.8 DIY：上传本地PDF资料
用GPT分析相关资料中提出问题。
用GPT总结评价（评阅、审稿意见）

3.GPT作为辅助工具下载数据

3.1使用GPT生成PERSIANN /GSMaP数据的下载代码

3.2使用GPT生成代码下载GSOD数据

3.3使用GPT生成代码下载NCEP/NCAR再分析数据

3.4使用GPT生成代码下载GFS预报数据

专题三：可视化专题——基于GPT实现

1.绘制常见统计图

2.绘制风场图、风羽图、风矢图、流线图

3.通过GPT绘制双Y轴

4.风玫瑰图

5.填充图

6.绘制添加子图

7.绘制期刊常见图

专题四：站点数据处理

使用GPT处理/生成相应代码，实现下列目标：

1.读取数据

1.1读取多种来源原始数据（ISD、GSDO）

2.缺失值处理

2.1缺失值统计

2.2常见统计方法缺失值填补

2.3机器学习方法填补数据

3.数据质量控制

3.1基于统计阈值的异常检测

3.2基于机器学习的异常检测（Isolation Forest等方法）

3.3多变量数据的异常检测（服务于自动气象站数据）

3.4基于时间序列方法均一化检验（服务于长时间气候变化评估）

4.时间序列的趋势

4.1移动平均法

4.2分解法（STL, Seasonal and Trend decomposition using loess）

4.3 Sen’s斜率

5.时间序列的突变检验

5.1 MK (Mann-Kendall): Mann-Kendall趋势检验（用于分析数据集中的趋势变化）

5.2 Pettitt: Pettitt检验（非参数检验方法，用于检测时间序列中的单一变化点）

5.3 BUT (Buishand U Test): Buishand U型统计检验

5.4 SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验（常用于气候数据的同质性检测）

5.5 BG (Buishand Range Test): Buishand范围检验

6.时间序列周期分析

6.1功率谱方法提取周期（提取气温、降水等周期）

6.2小波分析方法提取周期

6.3 EMD经验模态分解

6.4 EEMD集成经验模态分解

7.时间尺度上的统计

7.1不同时间尺度上的统计

8.回归分析

8.1线性回归（Linear Regression）:简单线性回归、多元线性回归等

8.2多项式回归（Polynomial Regression）:

8.3非参数回归（Non-parametric Regression）:

9.相关分析

9.1常见的相关系数（Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient）

9.2偏相关分析（Partial Correlation）

9.3典型相关分析（Canonical Correlation Analysis, CCA）

10.站点数据的空间化：

10.1克里格插值

10.2临近点插值

10.3反距插值

10.4 基于高程模型的外推

专题五：WRF专题——基于GPT和Python实现

1.静态数据的替换

1.1使用Python生成WPS的静态数据
A替换反照率和LAI数据

GPT生成转化GLASS（The Global Land Surface Satellite (GLASS) Product suite）替换默认粗分辨率数据。
B替换土地利用

GPT将多分类的ECI CCI土地利用数据分类进行整合，使之能够用于WPS系统；GPT生成转化代码，将数据转化为WPS可读取的二进制格式。
使用Python更改WRF初始场

GPT生成代码修改WRF初始场文件，并替换土地利用、地表反照率等静态数据。

2.生成WRF配置文件

2.1在指定的地区推荐WRF namelist.input文件相关参数

2.2补全相关参数信息

3.WRF的后处理

3.1站点插值

3.2能见度计算

3.3垂直高度变量插值

3.4降水相态辨识

3.5水汽通量

4.WRF的评估

4.1格点尺度评估

4.2点尺度评估

4.3模态评估

专题六：遥感降水专题——基于GPT和Python实现

1.将PERSSIAN/GSMaP数据转化为netCDF格式

2.合并数据

3.时间域统计并可视化

4.空间域统计并可视化

5.常见统计评估指标
生成统计指标空间图
生成泰勒图
生成卫星降雨散点密度图

专题七：再分析数据专题——基于GPT和Python实现

1.ERA5再分析数据

1.1 ERA5数据的下载

1.2 ERA5数据预处理

1.3多时间尺度统计

1.4干旱监测
计算标准化降水蒸散指数（SPEI）或标准化降水指数（SPI）作为干旱监测的指标。
根据土壤湿度和降水量数据，使用时间序列分析和阈值判断来评估干旱风险等级。

1.5极端指数计算
连续干旱天数
夏日指数
R99极端降水指数等

1.6趋势分析
滑动平均
累积距平
趋势分析代码
时间序列分析

2.多套再分析数据的气候趋势分析

2.1对比NCEP/NCAR、ERA5、CRU等均值

2.2趋势分析

3.风能资源评估

3.1计算研究区域内多年的平均风速

3.2计算风速的季节性变化和年际变异性

3.3计算空气密度

3.4计算盛行风

3.5计算风功率

3.6计算weibull分布

3.7基于站点和WRF模式的分析

3.8基于ERA5计算风功率

.太阳能资源评估

4.1计算每天的平均太阳辐射量

4.2分析日、月和季节性气候态时空格局

4.3计算趋势

专题八：CMIP6未来气候专题——基于GPT和Python实现

1.数据预处理：

1.1使用NetCDF工具（xarray）读取数据

1.2裁剪时间范围和空间范围

2.计算区域平均温度：

2.1对于全球平均温度加权平均

2.2对于特定区域，直接计算平均值

3.趋势分析：

3.1使用统计方法（如线性回归）分析温度随时间的变化趋势

4.可视化：

4.1绘制时间序列图显示温度趋势

4.2使用地图可视化工具（basemap）展示空间分布的变化

专题九：基于机器学习方法判断天气晴雨——基于GPT和Python实现机器学习操作流程

1.预处理

1.1缺失值处理：使用适当的策略填充或删除数据中的缺失值

1.2数据探索：通过统计摘要、可视化方法（如直方图、箱线图）来理解数据的分布、异常值情况和变量之间的关系

1.3数据标准化/归一化

1.4数据类型转换：将分类变量转换为数值型，使用独热编码（One-Hot Encoding）或标签编码（Label Encoding）

2.数据采样

2.1均衡采样：对不平衡的数据集进行重采样，确保各类别样本数量大致相同

2.2分层抽样：确保训练集和测试集中各类别样本的比例与原数据集相同，使用分层采样技术。

2.3交叉验证分割：采用交叉验证的方法来进行更可靠的模型评估，如K折交叉验证，保证每个样本被用于训练和验证。

2.4时间序列分割：对于时间序列数据，使用时间顺序分割数据，确保训练集中的数据点时间上早于测试集中的数据点。

3.特征工程

3.1特征选择：使用统计测试、模型系数或树模型的特征重要性来选择最有信息量的特征

3.2降维：使用主成分分析（PCA）、线性判别分析（LDA）等方法减少特征的维度

3.3多项式特征：生成特征的多项式组合，如平方项、交互项，以捕捉特征之间的非线性关系

4.模型建模与堆叠

4.1单模型训练：如决策树、SVM、随机森林。

4.2模型堆叠：使用mlxtend库或自定义方法实现模型堆叠，结合不同模型的预测结果作为新的特征，训练一个新的模型。

4.3调参：使用网格搜索（GridSearchCV）或随机搜索（RandomizedSearchCV）等方法优化模型参数。

4.4 集成学习：除了堆叠，还可以探索其他集成方法，如Bagging和Boosting，以提高模型的稳定性和准确性。

5.模型评估

5.1性能指标：根据问题类型（分类或回归）选择合适的评估指标，如准确度、召回率、F1分数、AUC值、均方误差

5.2模型解释性：使用SHAP对模型的预测进行解释，提高模型的可解释

查看全文

http://www.jsqmd.com/news/1002305/

从‘死神经元’到稳定训练：用PyTorch的LeakyReLU解决GAN训练中的常见崩溃问题

从‘开发’到‘验证’：一张图看懂DO-178C工具鉴定等级（TQL）怎么定，附工具选型避坑建议

避坑指南：N32G45X移植LVGL 8.3到ILI9488屏幕，我遇到的三个“坑”及填平方法

不止于RDF：用GROMACS后处理命令串起分子模拟的完整分析管线（含MSD、相互作用能）

番茄小说下载器技术解析与多平台部署指南

2026优选：东莞合创源环保节能科技有限公司——水保验收领域的专业协同伙伴 - 品牌发掘

短视频全案策划拍摄哪家更值得信赖

i茅台自动预约系统终极指南：解放双手的智能抢购解决方案

高维离散数据建模：KELP模型在EHR分析中的应用

从RDF到3D SDF：一次搞懂GROMACS后处理如何揭示分子间的“爱恨情仇”

asc-devkit开发套件——CANN上层工具的“加工厂“——从数据采集到性能分析的完整链路揭秘

WPF自定义窗口避坑指南：WindowChrome最大化时内容被任务栏遮挡？一招搞定！

别再硬啃官方文档了！手把手教你用Kalibr搞定D435i相机+IMU联合标定（Ubuntu 18.04）

【操作系统实验】Linux 下多线程同步与互斥实战——生产者 - 消费者模型

本地私有化部署企业网盘选型指南：IT运维客观测评与落地建议

终极指南：如何高效使用yuzu模拟器运行Switch游戏

easyquotation性能优化指南：如何实现毫秒级股票行情数据获取

2026年当前市场烘焙设备销售厂家找哪家？专业选型与青岛杰麦深度解析 - 品牌鉴赏官2026

别再死记硬背了！用ASM图搞定VHDL状态机设计，从交通灯到FPGA实战

2026年五金冲压件选购指南：从材质、工艺到供应商的全面分析 - 优质品牌商家

2026企业协同办公工具全方位测评：适配不同团队的数字化办公工具深度解析

Ubuntu部署Docker

2026年中，中山饰品套装源头工厂选择全攻略：聚焦瑞玛斯五金饰品的核心优势 - 品牌鉴赏官2026

2026年北京电动车维修怎么挑？5个关键点帮你找到靠谱上门服务 - 本地品牌推荐

告别WinForms默认丑界面：用Guna UI 2.0.4.4快速打造现代化桌面应用（附控件详解）

3分钟掌握：高效实用的网易云音乐ncm转mp3完整指南

2026年，聊城异形钢管供应商：聊城市宏宝钢管有限公司 - 企业推荐官【官方】

你的AMD处理器还有多少隐藏性能等待挖掘？

2026甄选：常州高端婚纱品牌实力之选与行业深度分析 - 品牌发掘

告别Excel图表！用aardio+ScottPlot给你的桌面软件快速集成专业级图表（附完整源码）

相关文章：