当前位置: 首页 > news >正文

时序预测大模型 Chronos模型

亚马逊研究团队于2024年提出的一种时间序列预测基础模型Chronos,代表了时间序列领域向大模型范式的重要转变。

模型的核心思想是将时间序列预测重塑为一个条件生成建模或语言建模任务。

设计思想

Chronos旨在成为一个通用的“预训练-微调”基础模型:

  • 统一表示:将多元时间序列的数值通过分桶(bucketing)和映射,转换为离散的token序列(类似于文本中的词汇)。

  • 基于Transformer的架构:采用纯解码器或编码器-解码器架构(如T5),像处理语言一样处理时间序列token序列。

  • 大规模预训练:在包含公开数据集的大规模时间序列语料库(如Monash、UCI等来源的约50亿个时间点)上进行预训练,学习通用的时序模式

主要技术特点

  • 量化与token化:

    • 对时间序列值进行分位数分桶,每个桶对应一个token ID。

    • 例如,将历史观测值“-0.5, 0.1, 1.3”转换为像“token_15, token_41, token_9”这样的序列。

  • 上下文学习:

    • 在预测时,输入为过去观测值的token序列,模型自回归地生成未来token序列。

    • 通过反向token化将预测token转换回数值。

  • 零样本/少样本能力:

    • 得益于大规模预训练,Chronos在未见数据集上表现出优秀的零样本预测性能。

    • 可通过少量示例(少样本)或轻量微调快速适配新任务。

工作流程

  1. 输入准备:对历史时间序列进行缩放、归一化、token化。

  2. 模型推理:输入上下文长度内的token,生成未来时间步的token序列。

  3. 输出解码:将预测token反转为数值,并可能进行后处理(如调整尺度)。

优势

  • 通用性强:一个模型适应多个领域(能源、交通、经济等)。

  • 简化流程:无需复杂的特征工程或为每个数据集单独设计模型。

  • 性能优越:在零样本和少样本设定下,其表现常超越传统统计模型(如ARIMA)和特定任务模型。

 

Chronos的“特征”局限性

Chronos 预训练的数据是数值型时间序列的点位,例如“昨天气温25度,今天26度”。它不支持在输入中直接加入以下常见特征:

  • 分类特征:如星期几、节假日、产品类别、店铺ID等。

  • 文本特征:如产品描述、新闻标题。

  • 其他外部回归变量:如促销活动标志、油价、汇率等。

它的“特征”本质上就是历史数值序列本身。 它从海量的、多样的单变量序列中学习通用的时间模式(趋势、周期、季节等),然后将这种模式迁移到新的序列上。

在实践中引入其他特征

如果预测任务必须依赖其他特征,可以采取以下几种工程化的变通方法,但这些方法不再是纯粹的零样本或少样本预测,需要一定的建模工作:

方法A:特征编码到时间序列中(最常用)

将外部特征编码成额外的、同步的时间序列通道,然后用 通道独立(Channel-Independent) 的方式处理,让模型隐式地学习关系。

  • 步骤:

    1. 创建多变量序列:假设要预测销售额Y,有外部特征“是否节假日H”和“气温T”。构造一个三变量的时间序列 [Y, H, T]

    2. 分别Token化:对每个变量单独进行分桶和Token化。

    3. 交错输入:将三个变量的历史Token按时间步交错排列:[Y_t1, H_t1, T_t1, Y_t2, H_t2, T_t2, ...]

    4. 训练/微调:在目标数据集上对预训练的Chronos模型进行微调。模型通过微调来学习YHT之间的关联。

  • 优点:能利用特征信息。

  • 缺点:必须进行微调,丧失了Chronos“开箱即用”的最大优势;且模型对特征关系的捕捉能力有限。

方法B:将特征作为条件前缀

借鉴大型语言模型的“提示”技术,将特征信息以文本或特殊Token的形式,作为预测任务的条件前缀(Conditional Prefix)。

  • 示例:对于预测“北京王府井店、星期天、夏季的冰淇淋销量”,可以构造一个提示前缀Token序列,如 [LOC_BEIJING, STORE_WFJ, DAY_SUNDAY, SEASON_SUMMER],然后跟上历史销量的Token序列,让模型基于此条件生成未来预测。

  • 现状:在原版Chronos论文和官方实现中并未强调或实现此功能,但这是一种理论上的扩展方向,需要重新设计和训练模型。

方法C:分组建模

将具有相同特征组合的序列分组,对每组数据分别使用Chronos进行零样本预测或微调。

  • 示例:将所有“北京、周末”的序列归为一组,用这组历史数据作为上下文示例(少样本学习),让Chronos预测新的“北京、周末”序列。

  • 优点:无需改变模型,利用了特征。

  • 缺点:数据被分割,每组数据量可能变少,影响预测稳定性。

 

Chronos模型的协变量

工作原理:

  1. 通道独立编码:每个协变量单独进行分桶token化

  2. 交错排列:按时间步交错协变量token

  3. 微调学习:在目标数据集上微调,让模型学习变量间关系

局限性:

  • 必须微调,丧失零样本能力

  • 模型只能学习训练数据中出现的模式

  • 处理未来已知协变量困难

def predict_chronos2(df, selected_features, target, prediction_length, id_column, timestamp_column, model_path='/Users/lxh-mac/Documents/models/amazon/chronos-2'):pipeline: Chronos2Pipeline = BaseChronosPipeline.from_pretrained(model_path, device_map="cpu")energy_pred_cov_df = pipeline.predict_df(df[[id_column, timestamp_column, target]],  # 暂时只使用目标变量,不使用协变量future_df=None,prediction_length=prediction_length,quantile_levels=[0.1, 0.5, 0.9],id_column=id_column,timestamp_column=timestamp_column,target=target,)return energy_pred_cov_df['predictions']

 

http://www.jsqmd.com/news/60949/

相关文章:

  • 2025 年分离机厂家最新推荐榜,聚焦技术实力与市场口碑深度解析碟式分离机/碟片式分离机/离心分离机/全自动分离机公司推荐
  • 2025 年化工泵厂家最新推荐榜,技术实力与市场口碑深度解析的优质品牌优选指南不锈钢化工泵/氟塑料化工泵公司推荐
  • 亲和图
  • 推荐一家北京做小程序靠谱的公司:3家零投诉企业核心优势拆解,抖音小程序/微信小程序/支付宝小程序/预约小程序/接诉即办/AI小程序/党政小程序多平台多领域小程序开发公司推荐
  • Nexpose 8.31.0 for Linux Windows - 漏洞扫描
  • 给旧版 .NET 开道 “私有通路”:ILAccess.Fody 达成逻辑与设计精髓
  • 2025年9款AI写论文工具实测:查重率低原创度高,毕业论文轻松搞定!
  • Redis性能优化避坑指南 - 详解
  • 2025年12月江苏排水沟、排水槽、U型槽、盖板制造厂家排行榜前十推荐
  • 添加SSL证书后 润乾报表参数模板报错:此表单不安全。因此,系统已关闭自动填充
  • 【EAI、JPCS出版 | EI检索 | 征稿主题广】第四届智慧能源与电气工程国际学术会议(SEEE 2025)
  • 2025年高倍率应急启动电源厂家推荐与产品评测指南
  • IDEA(2020版)sevlet+session模拟用户登录
  • 2025年12月北京小程序开发公司排名,基于客户复购率的3家优质服务商盘点,活动小程序/工单小程序/寺庙小程序/律所小程序定制小程序开发公司推荐
  • 【IEEE出版 | EI检索 | 往届检索良好】第六届机械自动化与智能制造国际学术会议(MAIM 2025)
  • 2025年12月微信小程序定制开发公司哪家靠谱,全国精选3家+北京本地服务商优先选,物业小程序/社区小程序/商城小程序/硬件小程序/电商小程序/投票小程序多领域全覆盖小程序开发公司推荐
  • C 盘瘦身必备:用 mklink 搬移插件和缓存
  • Oxygen Forensic Detective 18.1 发布,新增功能简介
  • 2025年12月北京小程序定制开发公司怎么选,4大避坑要点+实地考察攻略,含抖音小程序/微信小程序/支付宝小程序多平台小程序开发公司推荐
  • 2025 年足浴软件最新推荐榜,聚焦技术实力与市场口碑深度解析足浴管理软件/足疗管理软件/足疗收银软件公司推荐
  • 2025年灌浆料厂家推荐榜:无收缩/高强无收缩/水泥基/自流平/支座/灌浆料/试块,耐牛以质筑基,守护建筑安全
  • 2025年国内头部CTU货架厂商推荐榜单,重载货架/仓库存储货架/钢制货架/立体货架/悬臂货架/牛脚式货架/CTU货架产品口碑推荐
  • 2025年取材台推荐榜:病理/U字型/不锈钢/不锈钢自动升降/智能不锈钢下排风/取材台匠心之选赋能高效作业,北京中宝元五星领跑
  • 2025年商超照明品牌推荐榜:商超照明/灯具/灯光供应商光效赋能消费,富明阳引领,这些品牌照亮零售新空间
  • 植物大战僵尸杂交版下载安装教程(PC/安卓/iOS 全平台详解 常见问题解决)
  • 数据传输与隧道技术详解
  • 在思想的交汇处:误读如何成为理论创新的催化剂
  • Data Agent 选型看这三大价值,Aloudata Agent 实力“圈粉”
  • Windows系统本地持久化技术
  • ADCS配置启用LDAPS服务