当前位置：首页 > news >正文

TPC框架：深度时序条件化在时间序列预测中的应用

news 2026/6/13 11:49:10

1. 深度时序条件化方法解析

时间序列预测一直是数据分析领域的核心挑战之一。传统方法在处理多元时间序列时，往往难以有效捕捉长期依赖关系和复杂的时间模式。最近，大型语言模型（LLMs）因其强大的序列建模能力，开始被应用于时间序列分析领域。然而，现有方法对时间信息的处理大多停留在浅层注入阶段，导致时序特征在深层网络中逐渐衰减。

TPC（Temporal-Prior Conditioning）框架的创新之处在于将时间提升为"第一类模态"，与信号模态同等重要。这种方法通过专门设计的可学习时序令牌（TS-tokens），在多个网络层深度整合时序信息，而非仅在输入层注入一次。具体来说，TPC在冻结的LLM骨干网络中插入多个时序条件化模块，这些模块允许TS-tokens通过交叉注意力机制从人类可读的时间描述中提取时序嵌入，再通过自注意力将时序上下文传递给信号表示。

关键设计原则：保持信号模态与时序模态的解耦，避免直接混合两种信息流。这种分离式处理确保了各自特征的纯净性，同时通过注意力机制实现可控的信息交互。

2. 核心架构与实现细节

2.1 输入编码与表示分离

时间序列输入首先经过可逆实例归一化（RevIN）处理，以消除分布偏移问题。随后，序列被分割为重叠或非重叠的补丁（patches），每个补丁通过线性投影映射到LLM的嵌入空间：

E_i = W_e * X_P,i + b_e

其中，W_e ∈ R^(d×L_p)是学习得到的权重矩阵，b_e是偏置项，d是LLM的隐藏层维度。与此同时，系统初始化一组可学习的TS-tokens X_f^(0) ∈ R^(n_f×d)，这些令牌将与补丁嵌入拼接后输入模型：

H^(0) = [E_i || X_f^(0)] ∈ R^((P+n_f)×d)

这种设计实现了信号流（补丁嵌入）与时序流（TS-tokens）的物理分离，为后续的深度条件化奠定了基础。

2.2 时序嵌入生成机制

TPC采用了一种独特的时间描述方法，将时间信息编码为自然语言提示。例如，对于特定时间跨度，系统生成类似"此序列覆盖2017-01-01至2017-01-02"的文本描述。这些文本通过冻结LLM的嵌入层转换为词向量，再经过LLM前向传播得到最终的时序嵌入：

e_temp^p = LLM_frozen(E_LLM(Tok(x^(p))))[-1,:]

这种设计有三大优势：

利用LLM已有的语言理解能力捕捉日历效应、季节模式等复杂时间特征
生成的时序嵌入与LLM隐藏状态同处一个语义空间，便于后续整合
可预先计算并缓存，显著降低推理时的计算开销

2.3 跨层时序条件化

TPC模块被插入到冻结LLM的选定层中，其工作流程可分为三个阶段：

自注意力交互：补丁嵌入与TS-tokens通过标准的因果自注意力进行信息交换，确保信号流能感知TS-tokens携带的上下文。
门控交叉注意力：只有TS-tokens被允许查询时序嵌入库E_temp：
```
CA = softmax((Q_temp * K_temp^T)/√d) * V_temp
```
其中查询来自TS-tokens，键值对来自时序嵌入。学习得到的门控系数σ(a_1)控制信息注入强度。
门控前馈传播：更新后的表示通过另一个可学习门控的前馈网络，进一步增强模型的表达能力。

这种模块化设计确保了时序信息能够深度渗透到网络各层，而非仅在输入阶段发挥作用。