当前位置: 首页 > news >正文

时序 KAN 持续发力!靠它人人都能水一篇,此时不冲,更待何时!

发展至今,时间序列分析的创新依然是刚需,无论是在预测还是异常检测任务上。一方面,传统深度学习模型如Transformer等在提升性能的同时,其“黑箱”特性和对细微噪声的过拟合问题始终是挑战;另一方面,模型的可解释性和效率在实际应用中愈发重要。这点在各会议期刊上都有所体现。

2024年横空出世的Kolmogorov-Arnold网络(KAN),凭借其基于数学定理的结构和潜在的可解释性,为解决上述困境提供了全新视角。不过,要想让这一通用框架在特定领域落地,绝非简单的“即插即用”。如何根据任务特性(如时间序列的周期性、趋势性)改造KAN的激活函数、如何设计高效稳定的训练策略,便成了新的研究热点。本文解析的两篇论文正是这一方向的优秀代表,为我们展示了如何“魔改”KAN来水,为大家寻找新的研究切入点提供了绝佳范例。

另外,我整理了时间序列+KAN相关论文合集~希望能帮到你!

原文、姿 料,这里!

一、论文1:Are KANs Effective for Multivariate Time Series Forecasting?

方法:

论文提出了一种名为多层混合KAN网络(Multi-layer Mixture-of-KAN network, MMK)的模型。

其核心是一个创新的混合KAN层(Mixture-of-KAN, MoK)。该层借鉴了混合专家(Mixture-of-Experts, MoE)的思想,通过一个门控网络,将输入的不同变量自适应地分配给最匹配的KAN“专家”进行处理。每个专家本身是一个拥有不同基函数(如B样条、小波、雅可比多项式等)的KAN变体。通过堆叠多个MoK模块,并结合RevIN归一化和一种预采样初始化策略来解决深度KAN训练不稳定的问题,最终实现高精度的预测。

创新点:

  • 首次全面评估:据作者所知,这是首个全面且系统性地探讨新兴的KAN架构在多变量时间序列预测任务中有效性的工作,为后续研究提供了可靠的基准。

  • 混合专家KAN层:提出了MoK层的概念,巧妙地将MoE架构与多种KAN变体结合。这使得模型能够聚合不同基函数的优势,自适应地处理不同变量的独特数据分布,解决了为特定任务手动选择最佳KAN变体的难题。

  • 训练策略优化:识别并解决了深度KAN模型在训练中损失过大且不稳定的问题,并提出了一种有效的预采样初始化 (pre-sampling initialization)策略来保证训练过程的稳定性。

  • 代码链接:https://github.com/2448845600/EasyTSF

  • 论文链接:https://arxiv.org/pdf/2408.11306

二、论文2:KAN-AD: Time Series Anomaly Detection with Kolmogorov–Arnold Networks (ICML 2025)

方法:

论文提出了一种名为KAN-AD的新型时间序列异常检测框架。该方法的核心思想是,通过平滑的单变量函数来逼近时间序列的“正常”模式,从而对局部噪声和扰动(如局部峰值、下降)保持鲁棒。具体而言,它对原始KAN进行了三方面改造:

  1. 用具有更好平滑性和周期建模能力的傅里叶级数 (Fourier series)替代了原始KAN中容易过拟合局部特征的B样条基函数。

  2. 通过一个轻量级的1D CNN网络来学习傅里叶级数的组合系数,高效地重构正常模式。

  3. 在预处理阶段采用一阶差分来消除数据趋势,提升模型建模的准确性。

创新点:

  • 问题重构:将时间序列异常检测问题重新定义为“用一组平滑的单变量函数逼近正常模式”。这一视角从根本上解决了传统预测模型易于过拟合训练数据中局部噪声的痛点。

  • KAN的适配改造:创新地将原始KAN中需要在训练中学习的B样条函数,替换为固定的、数学特性(平滑、周期性)更适合时序任务的傅里叶级数。这不仅提升了鲁棒性,也体现了针对具体任务改造KAN核心部件的思路。

  • 高效轻量:模型架构极为高效。它不学习复杂的函数本身,而是通过一个参数量极少的1D CNN学习一组固定的傅里叶基函数的线性组合系数。这使得KAN-AD在实现SOTA性能的同时,参数量极低,推理速度极快。其核心的傅里叶分解公式如下:

  • 代码链接:https://github.com/CSTCloudOps/KAN-AD

  • 论文链接:https://arxiv.org/abs/2411.00278

http://www.jsqmd.com/news/507541/

相关文章:

  • SAP选择屏幕隐藏selection options的常见问题及解决方案
  • 2026年江苏无锡抖音推广公司TOP5名单出炉,盘点本地服务格局现状 - 精选优质企业推荐榜
  • 从流量包到攻击链:一次APT攻击的深度取证WriteUp
  • 推荐一个高效学习SpringBoot的方法!
  • Ubuntu-无网络环境下快速部署开发环境(gcc、make、dkms等)
  • 产品经理必看!用Draw.io快速绘制专业状态流转图(含电商订单案例)
  • 羊绒衫定制如何找到可靠厂家?2026年优质推荐涵盖OEM与ODM专业服务 - 品牌推荐
  • 微信小程序中实现气泡提示框、图片css加载动画及容错处理
  • 2026化工领域钢衬四氟储罐优质厂家推荐榜 - 资讯焦点
  • 标签多伯努利滤波器(LMB):多目标跟踪中的身份一致性保障机制
  • 深入解析set_max_delay与set_min_delay在异步电路时序约束中的关键作用
  • 工业设计赋能:CYBER-VISION零号协议解读与生成SolidWorks设计注释
  • 壹方设计电话查询:获取联系方式的实用建议 - 品牌推荐
  • 摒弃有害厨具,京尚黑科技陶瓷锅,开启高端健康烹饪时代
  • SpringBoot如何快速精通?
  • Cortex-M3 特色功能——位带操作(Bit-Band)
  • 商店盗窃行为破窗行为商品安防检测数据集VOC+YOLO格式2173张1类别
  • 2026环保合规纸塑染料助剂优质厂家推荐 - 资讯焦点
  • Qwen3.5-9B图文对话精彩案例:上传电路图问原理、传PPT页问逻辑漏洞
  • 免费获取乡镇级GeoJson边界数据的3种实用方法
  • 气熙B7空气净化器电话查询:使用前需了解的关键注意事项 - 品牌推荐
  • 长寿命检测开关的新选择:ALPS SPVT210101 VS 国产替代 TONEVEE KFC-VT-318BY 高达2万次寿命
  • 履霜坚冰,龙战于野:当权力失去约束,欲望成为人性的灾难
  • AES算法解剖课:用MATLAB逐行还原字节代换/行位移的数学之美
  • PyTorch中autograd.Function.apply的5个实战技巧(附自定义ReLU实现)
  • Acme .NET 工具类库:一站式解决.NET开发高频场景问题
  • 室内要素识别建筑物内部地面墙壁天花板识别分割数据集labelme格式1031张3类别
  • 2026年消防桥架厂家推荐:防火/镀锌/大跨度/节能桥架专业供应商精选——郑州畅通机电有限公司 - 品牌推荐官
  • 2026 SRM 系统深度测评:鲸采云凭自定义适配多行业采购场景
  • 2024年Java vs Go vs Python:企业级开发选谁更香?实战代码对比