当前位置: 首页 > news >正文

ITransformer: Inverted Transformers Are Effective for Time Series Forecasting


解释典型的Transformer架构用于时序预测效果差的原因,它们的观点:

由单个时间步长形成的Token,由于过于局部的感受野同时时间点表示的时间不对齐事件而难以显示有益信息。

时间序列预测模型的标准设定:

输入 (历史窗)XXX:包含TTT个时间步,NNN个变量。矩阵维度为RT∗NR^{T*N}RTN;

输出(预测窗)YYY: 预测未来SSS个时间步,同样包含NNN个变量, 矩阵维度为RS∗NR^{S*N}RSN

数据处理的两种视角:

(1)Xt,:X_{t,:}Xt,::ttt时刻所有变量的快照。表示的是Excel表格中的一行,代表“此时此刻所有传感器的读数”。大多数Transformer(如Informer)是将这个Xt:X_{t:}Xt:, 作为一个TokenTokenToken输入模型。

(2)X:,nX_{:,n}X:,n: 第nnn个变量的完整时间序列,Excel中的一列,代表 ”某个传感器在过去一段时间内的所有读数“。

为什么否定Xt,:X_{t,:}Xt,:?

直接处理Xt,:X_{t,:}Xt,:(即把同一时刻的不同变量揉在一起)在物理意义上的两个缺点:

(1)系统性时滞(Systematical Time Lags):在现实世界中,因果关系往往不是瞬时的,如果强制模型只看Xt:X_{t:}Xt:(同时关注ttt时刻的A和B),可能变量在该时刻并不具备直接因果关系的数据点,真正的关联式错位的。

(2)物理量纲与分布的差异:同一时刻的Xt,:X_{t,:}Xt,:包含了性质完全不同的数据。这些数据的语义空间(Semantic Space)完全不同。虽然可以归一化,但是在深度学习,将这些物理意义极不相同的数值映射到同一个特征空间进行交互,难以学习到鲁棒的特征。

为什么拥抱X:nX_{:n}X:n?

单个变量的整条序列具有物理一致性,该变量在ttt时刻和t+1t+1t+1时刻的物理性质不变,它们的统计分布是平稳的。将X:nX_{:n}X:n视为一个Token进行Embedding,模型更容易学习到特征。

层归一化:

在此前Transformer中,层归一化将同一时刻的的多个变量进行归一化,使**每个变量杂糅无法区分**,提高了注意力建模词关联的难度。一旦收集到的数据没有按时间对齐,该操作还将引入延迟过程之间的噪声干扰。

在倒置版本中,层归一化作用于Variate Token内部,让所有变量的特征都**处于相对统一的分布下,减弱测量单位的差异**。这种方式还可以有效处理时间序列的非平稳问题问题。

前馈网络:

基于多层感知机的万能表示定理,前馈网络作用在整条序列上,能够提取序列的内在属性,例如幅值,周期性,频率谱(傅立叶变换可视作在序列上的全连接映射),从而提高在其他的序列上的泛化性。

在原始的Transformer中,模型的预测效果不一定随着输入的历史观测的变长而提升,在使用倒置框架之后,模型随着历史观测长度的增加,呈现明显的预测误差降低趋势。

http://www.jsqmd.com/news/111382/

相关文章:

  • word2markdown:一款优秀的Word转Markdown工具
  • Mistral 3 模型解析与部署实战:从 Large 3 到 Mini-stral
  • 10 个降AI率工具,本科生高效避坑指南
  • Kubernetes 实操命令大全
  • 研究生必备:8款免费AI论文工具,一键生成文献综述,真实引用无忧! - 麟书学长
  • bootchart数据量化工具使用
  • SG-TCP232-620(六通道串口服务器)特点与功能介绍
  • Linux 实操命令大全
  • [服务器应用开发教程]第二节-使用java让服务器忙起来
  • 【C++】学生管理系统设计与实现丨SQLite数据库版本
  • 【LangChain4J】流式输出(底层和高级api两种模式)
  • P1525 [NOIP 2010 提高组] 关押罪犯
  • 51单片机温度报警器:从C程序到Proteus仿真全记录
  • 集之互动AI创意视频解决方案:商业级可控,让品牌创意从“灵感”直达“落地”
  • 深入解析:【号码分离】从Excel表格、文本、word文档混乱文字中提取分离11位手机号出来,基于WPF的实现方案
  • Android开机性能分析工具bootchart详细使用
  • Test-2025
  • 9个高效降AI率工具,本科生必看!
  • 10个高效降AI率工具,自考学生必备!
  • 【2025实测】12款主流降ai率工具大汇总,论文降aigc一篇搞定(含免费降ai率工具) - 晨晨_分享AI
  • CentOS 7.9 在 VMware 17.5.0 上的完整安装教程
  • 计算机专业自学指南:从大一到大四,步步为营!从零基础到精通,收藏这篇就够了!
  • 从零开始的云原生之旅(十八):部署热更新——无需重启服务的幕后
  • 非专业也能看懂的AI大模型工作原理!(非常详细)从零基础到精通,一篇就够了!
  • 空间转录组上游(Space Ranger)
  • 详细揭秘如何使用 对哦 原理
  • vulkan中的SSBO
  • 非期望超效率SBM模型:Matlab实现与探讨
  • 告别频繁校准,效率成本双拿捏!这款MEMS寻北仪刷新行业新体验
  • AI元人文构想:从价值对齐到意义生成的哲学范式革命