当前位置: 首页 > news >正文

“AI大语言模型”助力大气科学相关交叉领域实践技术应用

专题一:预备知识
1.大语言模型在大气科学中的常见应用场景

ChatGPT是一种基于自然语言处理的技术,因此在大气科学领域应用主要集中在文本处理和语言生成方面。例如:

1.1 辅助数据分析:ChatGPT 可以帮助理解和解释大量的气象数据内在信息。

1.2自然语言处理:用于分析和解释历史气象记录、研究论文或报告,提取关键信息和趋势

1.3 文献搜索和综述:ChatGPT 可以撰写文献综述,同时快速查找和总结相关研究及论文

1.4 论文撰写辅助:辅助撰写科研论文,提供文本编辑和改进建议

1.5 专业咨询:ChatGPT提供有关特定研究技术方法的专业建议。

1.6 教学工具:ChatGPT 可以帮助学生理解复杂的大气概念和编程相关问题

2.大语言模型常见平台使用方法

2.1 POE使用方法

2.2 ChatGPT使用方法

3.提示词工程

3.1 提示词工程介绍

3.2 提示词工程讲解

3.3 提示词常见模板

4.Python简明教程

4.1 Python基本语法

4.2 Numpy使用

4.3 Pandas使用

4.4 Xarray使用

4.5 Matplotlib使用

专题二:科研辅助专题

1.GPT作为科研工具

1.1把GPT当作搜索引擎

1.2把GPT当作翻译软件

1.3把GPT当作润色工具

1.4用GPT提取整理文章数据

1.5用GPT数据处理

2.GPT作为科研助手生成

2.1用GPT分析结果

2.2用GPT总结生成论文摘要

2.3用GPT总结生成文献综述

2.4用GPT分析论文技术方法

2.5用GPT分析代码

2.6用GPT分析论文公式

2.7用GPT识别图片并分析

2.8 DIY:上传本地PDF资料
用GPT分析相关资料中提出问题。
用GPT总结评价(评阅、审稿意见)

3.GPT作为辅助工具下载数据

3.1使用GPT生成PERSIANN /GSMaP数据的下载代码

3.2使用GPT生成代码下载GSOD数据

3.3使用GPT生成代码下载NCEP/NCAR再分析数据

3.4使用GPT生成代码下载GFS预报数据

专题三:可视化专题——基于GPT实现

1.绘制常见统计图

2.绘制风场图、风羽图、风矢图、流线图

3.通过GPT绘制双Y轴

4.风玫瑰图

5.填充图

6.绘制添加子图

7.绘制期刊常见图

专题四:站点数据处理

使用GPT处理/生成相应代码,实现下列目标:

1.读取数据

1.1读取多种来源原始数据(ISD、GSDO)

2.缺失值处理

2.1缺失值统计

2.2常见统计方法缺失值填补

2.3机器学习方法填补数据

3.数据质量控制

3.1基于统计阈值的异常检测

3.2基于机器学习的异常检测(Isolation Forest等方法)

3.3多变量数据的异常检测(服务于自动气象站数据)

3.4基于时间序列方法均一化检验(服务于长时间气候变化评估)

4.时间序列的趋势

4.1移动平均法

4.2分解法(STL, Seasonal and Trend decomposition using loess)

4.3 Sen’s斜率

5.时间序列的突变检验

5.1 MK (Mann-Kendall): Mann-Kendall趋势检验(用于分析数据集中的趋势变化)

5.2 Pettitt: Pettitt检验(非参数检验方法,用于检测时间序列中的单一变化点)

5.3 BUT (Buishand U Test): Buishand U型统计检验

5.4 SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验(常用于气候数据的同质性检测)

5.5 BG (Buishand Range Test): Buishand范围检验

6.时间序列周期分析

6.1功率谱方法提取周期(提取气温、降水等周期)

6.2小波分析方法提取周期

6.3 EMD经验模态分解

6.4 EEMD集成经验模态分解

7.时间尺度上的统计

7.1不同时间尺度上的统计

8.回归分析

8.1线性回归(Linear Regression):简单线性回归、多元线性回归等

8.2多项式回归(Polynomial Regression):

8.3非参数回归(Non-parametric Regression):

9.相关分析

9.1常见的相关系数(Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient)

9.2偏相关分析(Partial Correlation)

9.3典型相关分析(Canonical Correlation Analysis, CCA)

10.站点数据的空间化:

10.1克里格插值

10.2临近点插值

10.3反距插值

10.4 基于高程模型的外推

专题五:WRF专题——基于GPT和Python实现

1.静态数据的替换

1.1使用Python生成WPS的静态数据
A替换反照率和LAI数据

GPT生成转化GLASS(The Global Land Surface Satellite (GLASS) Product suite)替换默认粗分辨率数据。
B替换土地利用

GPT将多分类的ECI CCI土地利用数据分类进行整合,使之能够用于WPS系统;GPT生成转化代码,将数据转化为WPS可读取的二进制格式。
使用Python更改WRF初始场

GPT生成代码修改WRF初始场文件,并替换土地利用、地表反照率等静态数据。

2.生成WRF配置文件

2.1在指定的地区推荐WRF namelist.input文件相关参数

2.2补全相关参数信息

3.WRF的后处理

3.1站点插值

3.2能见度计算

3.3垂直高度变量插值

3.4降水相态辨识

3.5水汽通量

4.WRF的评估

4.1格点尺度评估

4.2点尺度评估

4.3模态评估

专题六:遥感降水专题——基于GPT和Python实现

1.将PERSSIAN/GSMaP数据转化为netCDF格式

2.合并数据

3.时间域统计并可视化

4.空间域统计并可视化

5.常见统计评估指标
生成统计指标空间图
生成泰勒图
生成卫星降雨散点密度图

专题七:再分析数据专题——基于GPT和Python实现

1.ERA5再分析数据

1.1 ERA5数据的下载

1.2 ERA5数据预处理

1.3多时间尺度统计

1.4干旱监测
计算标准化降水蒸散指数(SPEI)或标准化降水指数(SPI)作为干旱监测的指标。
根据土壤湿度和降水量数据,使用时间序列分析和阈值判断来评估干旱风险等级。

1.5极端指数计算
连续干旱天数
夏日指数
R99极端降水指数等

1.6趋势分析
滑动平均
累积距平
趋势分析代码
时间序列分析

2.多套再分析数据的气候趋势分析

2.1对比NCEP/NCAR、ERA5、CRU等均值

2.2趋势分析

3.风能资源评估

3.1计算研究区域内多年的平均风速

3.2计算风速的季节性变化和年际变异性

3.3计算空气密度

3.4计算盛行风

3.5计算风功率

3.6计算weibull分布

3.7基于站点和WRF模式的分析

3.8基于ERA5计算风功率

.太阳能资源评估

4.1计算每天的平均太阳辐射量

4.2分析日、月和季节性气候态时空格局

4.3计算趋势

专题八:CMIP6未来气候专题——基于GPT和Python实现

1.数据预处理:

1.1使用NetCDF工具(xarray)读取数据

1.2裁剪时间范围和空间范围

2.计算区域平均温度:

2.1对于全球平均温度加权平均

2.2对于特定区域,直接计算平均值

3.趋势分析:

3.1使用统计方法(如线性回归)分析温度随时间的变化趋势

4.可视化:

4.1绘制时间序列图显示温度趋势

4.2使用地图可视化工具(basemap)展示空间分布的变化

专题九:基于机器学习方法判断天气晴雨——基于GPT和Python实现机器学习操作流程

1.预处理

1.1缺失值处理:使用适当的策略填充或删除数据中的缺失值

1.2数据探索:通过统计摘要、可视化方法(如直方图、箱线图)来理解数据的分布、异常值情况和变量之间的关系

1.3数据标准化/归一化

1.4数据类型转换:将分类变量转换为数值型,使用独热编码(One-Hot Encoding)或标签编码(Label Encoding)

2.数据采样

2.1均衡采样:对不平衡的数据集进行重采样,确保各类别样本数量大致相同

2.2分层抽样:确保训练集和测试集中各类别样本的比例与原数据集相同,使用分层采样技术。

2.3交叉验证分割:采用交叉验证的方法来进行更可靠的模型评估,如K折交叉验证,保证每个样本被用于训练和验证。

2.4时间序列分割:对于时间序列数据,使用时间顺序分割数据,确保训练集中的数据点时间上早于测试集中的数据点。

3.特征工程

3.1特征选择:使用统计测试、模型系数或树模型的特征重要性来选择最有信息量的特征

3.2降维:使用主成分分析(PCA)、线性判别分析(LDA)等方法减少特征的维度

3.3多项式特征:生成特征的多项式组合,如平方项、交互项,以捕捉特征之间的非线性关系

4.模型建模与堆叠

4.1单模型训练:如决策树、SVM、随机森林。

4.2模型堆叠:使用mlxtend库或自定义方法实现模型堆叠,结合不同模型的预测结果作为新的特征,训练一个新的模型。

4.3调参:使用网格搜索(GridSearchCV)或随机搜索(RandomizedSearchCV)等方法优化模型参数。

4.4 集成学习:除了堆叠,还可以探索其他集成方法,如Bagging和Boosting,以提高模型的稳定性和准确性。

5.模型评估

5.1性能指标:根据问题类型(分类或回归)选择合适的评估指标,如准确度、召回率、F1分数、AUC值、均方误差

5.2模型解释性:使用SHAP对模型的预测进行解释,提高模型的可解释

http://www.jsqmd.com/news/1002305/

相关文章:

  • 从‘死神经元’到稳定训练:用PyTorch的LeakyReLU解决GAN训练中的常见崩溃问题
  • 从‘开发’到‘验证’:一张图看懂DO-178C工具鉴定等级(TQL)怎么定,附工具选型避坑建议
  • 避坑指南:N32G45X移植LVGL 8.3到ILI9488屏幕,我遇到的三个“坑”及填平方法
  • 不止于RDF:用GROMACS后处理命令串起分子模拟的完整分析管线(含MSD、相互作用能)
  • 番茄小说下载器技术解析与多平台部署指南
  • 2026优选:东莞合创源环保节能科技有限公司——水保验收领域的专业协同伙伴 - 品牌发掘
  • 短视频全案策划拍摄哪家更值得信赖
  • i茅台自动预约系统终极指南:解放双手的智能抢购解决方案
  • 高维离散数据建模:KELP模型在EHR分析中的应用
  • 从RDF到3D SDF:一次搞懂GROMACS后处理如何揭示分子间的“爱恨情仇”
  • asc-devkit开发套件——CANN上层工具的“加工厂“——从数据采集到性能分析的完整链路揭秘
  • WPF自定义窗口避坑指南:WindowChrome最大化时内容被任务栏遮挡?一招搞定!
  • 别再硬啃官方文档了!手把手教你用Kalibr搞定D435i相机+IMU联合标定(Ubuntu 18.04)
  • 【操作系统实验】Linux 下多线程同步与互斥实战——生产者 - 消费者模型
  • 本地私有化部署企业网盘选型指南:IT运维客观测评与落地建议
  • 终极指南:如何高效使用yuzu模拟器运行Switch游戏
  • easyquotation性能优化指南:如何实现毫秒级股票行情数据获取
  • 2026年当前市场烘焙设备销售厂家找哪家?专业选型与青岛杰麦深度解析 - 品牌鉴赏官2026
  • 别再死记硬背了!用ASM图搞定VHDL状态机设计,从交通灯到FPGA实战
  • 2026年五金冲压件选购指南:从材质、工艺到供应商的全面分析 - 优质品牌商家
  • 2026企业协同办公工具全方位测评:适配不同团队的数字化办公工具深度解析
  • Ubuntu部署Docker
  • 2026年中,中山饰品套装源头工厂选择全攻略:聚焦瑞玛斯五金饰品的核心优势 - 品牌鉴赏官2026
  • 2026年北京电动车维修怎么挑?5个关键点帮你找到靠谱上门服务 - 本地品牌推荐
  • 告别WinForms默认丑界面:用Guna UI 2.0.4.4快速打造现代化桌面应用(附控件详解)
  • 3分钟掌握:高效实用的网易云音乐ncm转mp3完整指南
  • 2026年,聊城异形钢管供应商:聊城市宏宝钢管有限公司 - 企业推荐官【官方】
  • 你的AMD处理器还有多少隐藏性能等待挖掘?
  • 2026甄选:常州高端婚纱品牌实力之选与行业深度分析 - 品牌发掘
  • 告别Excel图表!用aardio+ScottPlot给你的桌面软件快速集成专业级图表(附完整源码)