当前位置: 首页 > news >正文

ETTh1_base

完全同意! 🎯 这个框架非常专业和可靠。这是标准的学术对比实验设计。

让我基于这个框架,给你修正后的命令


基于这个框架的修正命令

✅ Base 版本(必须这样跑)

python -u run.py --is_training 1 --model_id baseline_std ^--root_path ./dataset/ETT-small/ --data_path ETTh1.csv ^--model PRformer --data ETTh1 --features M ^--seq_len 720 --label_len 48 --pred_len 96 ^--e_layers 5 --d_layers 1 --d_model 512 --d_ff 2048 ^--batch_size 64 --train_epochs 50 --patience 10 ^--convWindows 24 48 72 144 --rnnMixTemperature 0.002 ^--loss mae --learning_rate 0.001 --lradj type3 ^--des Baseline_Standard

说明:

  • e_layers 5 ← 论文结构,不能改
  • convWindows 24 48 72 144 ← 核心创新PRE,不能改
  • 🟡 d_model 512 ← 从720降(显存考虑,但保持结构)
  • 🟡 batch_size 64 ← 从256降(显存考虑)
  • 🟡 train_epochs 50 ← 比论文30稍多(保险)
  • 🟡 loss mae ← 论文规定,必须用

✅ 你的改进版本(对标Base)

# 先恢复改进版
Copy-Item '.\layers\Embed.py.improved' '.\layers\Embed.py' -Force
Copy-Item '.\model\PRformer.py.improved' '.\model\PRformer.py' -Force# 运行改进版
python -u run.py --is_training 1 --model_id improved_std ^--root_path ./dataset/ETT-small/ --data_path ETTh1.csv ^--model PRformer --data ETTh1 --features M ^--seq_len 720 --label_len 48 --pred_len 96 ^--e_layers 5 --d_layers 1 --d_model 512 --d_ff 2048 ^--batch_size 64 --train_epochs 50 --patience 10 ^--convWindows 24 48 72 144 --rnnMixTemperature 0.002 ^--loss mae --learning_rate 0.001 --lradj type3 ^--des Improved_All3Features

关键:

  • 除了改进代码,所有参数和Base完全一样
  • ✅ 这样对比才有意义

你的实验计划应该是这样的

Phase 1: Run Baseline↓记录: MAE, MSE, 收敛情况↓
Phase 2: Run Improved (3个改进都加)↓记录: MAE, MSE, 改进百分比↓
Phase 3: (可选) Ablation- 只加改进1- 只加改进2- 只加改进3

核心检查清单

检查项 Base Improved
seq_len 720 720 ✅
pred_len 96 96 ✅
e_layers 5 5 ✅
convWindows 24 48 72 144 24 48 72 144 ✅
d_model 512 512 ✅
batch_size 64 64 ✅
loss mae mae ✅
learning_rate 0.001 0.001 ✅
epochs 50 50 ✅

如果这个表都对勾✅,你的对比就是严谨的!


现在可以直接运行吗?

  1. 确保code已还原为Base版本(之前验证过了✅)
  2. 运行Base命令
  3. 等完成后,记录最终的MAE/MSE
  4. 再恢复改进版,完整对比

要不要我直接帮你运行第一个Base命令?

http://www.jsqmd.com/news/641871/

相关文章:

  • 别再只盯着分类了!YOLOv9里的DFL Loss,原来是这样搞定边界框回归的
  • 5分钟掌握SketchUp STL插件:3D打印模型转换完整指南
  • AI PM | 我做了一个会自己进化的网站
  • 宝塔面板如何查看系统CPU占用趋势_监控面板自带性能报表
  • 运维视角复盘:一个‘顺心借’金融App的后台服务器架构与安全配置踩坑记录
  • 千分尺 | 操作规范及实操读数
  • 如何无线地将照片从 iPhone 传输到 PC?
  • STM32与AHT20温湿度传感器:基于状态机的中断驱动开发实践
  • 告别填表焦虑!盘点 2026 年最能提升转化率的 10 款表单构建工具
  • 检索增强生成(RAG)技术深度解析:从原理到工业级实践
  • **发散创新:基于Python的Notebook开发新范式——从数据探索到自动化部署的一
  • Phi-3-mini-128k-instruct镜像免配置价值:省去vLLM编译、CUDA版本适配、依赖冲突解决
  • 【权威认证|IEEE Fellow亲授】2026奇点大会图像描述生成技术成熟度评估矩阵(含6维度量化打分表)
  • 1 混合量子行走模型——从统一理论到量子算法应用 第一章:引言:量子行走的统一视角
  • KMS_VL_ALL_AIO终极指南:5分钟学会Windows和Office智能激活
  • 高性能计算中的Apptainer_Singularity容器技术解析
  • 1746-NR4 SLC 500 4点RTD热电阻输入模块
  • FanControl终极指南:5分钟掌握Windows风扇控制的完整解决方案
  • PDF-Parser-1.0快速上手:手把手教你用Web界面提取PDF文字和表格
  • 基于 Anthropic Claude API 的自动化代码安全审计工具
  • 工业CT三维重建技术全解析:从断层扫描到高精度3D模型的内部透视
  • 做了多年精益改善却没效果?精益改善不是工具,是机制
  • 告别卡顿!用RK3588+QuickRun打造多任务AI视觉系统:充电桩、垃圾分类、悬崖检测一板搞定
  • Socket--UDP 构建简单聊天室
  • EC 数据驱动的颠簸指数计算python全解析
  • 为什么你的AIAgent在压测中“静默崩溃”?揭秘LLM调用链中缺失的5层调试元数据
  • RAG学习之-Rerank 技术详解:从入门到面试
  • 【2026奇点大会权威解码】:文档理解模型的5大技术跃迁与企业落地避坑指南
  • 多模态知识蒸馏四大陷阱与破局方案(工业级部署避坑手册)
  • 5 分钟实现 MySQL 监控:用 mysql_exporter 把数据库指标全喂给 Prometheus