当前位置：首页 > news >正文

大型语言模型推理标记的本质与SoT框架解析

news 2026/6/26 7:14:20

1. 大型语言模型推理标记的本质解析

在当今人工智能领域，大型语言模型(LLM)的推理能力已成为研究热点。当我们观察这些模型解决复杂问题的过程时，常会看到它们生成一系列看似"思考步骤"的中间文本，如"首先...然后...因此..."等。这些被统称为"推理标记"(reasoning tokens)的文本序列，表面上看像是模型在展示其思考过程，但最新研究表明，这种直观理解可能完全偏离了它们的真实功能。

1.1 推理标记的双重身份

推理标记实际上扮演着两种截然不同的角色：

对人类读者：它们呈现为可读的自然语言文本，似乎描述了模型的"思考"过程
对模型自身：它们作为计算状态(state)的载体，在模型的无状态生成周期之间传递必要信息

这种双重身份导致了一个根本性的认知偏差：我们倾向于将推理标记解读为解释性文本，而实际上它们的主要功能是作为计算过程的"脚手架"。

关键区别：推理标记(reasoning tokens)与推理文本(reasoning text)是同一事物的两种解读方式。前者指模型生成的原始符号序列，后者指人类对这些符号按自然语言语义进行的解释。

1.2 白板类比：理解状态传递机制

想象你被关在一个房间里，面前有一块白板写着问题。每10秒钟你的记忆会被完全重置，唯一能做的就是读取白板当前内容并添加一个词。要解决这个问题，你会：

在白板上记录中间结果(数字、结论或部分计算)
可能使用编码方案(缩写、符号甚至看似无意义的标记)
不会记录所有内部计算步骤，只保留对下一步有用的信息

这个场景完美模拟了LLM的运作方式：

白板上的文字 = 推理标记
你 = 语言模型
10秒间隔 = 模型有限的单周期计算能力

2. SoT框架：计算状态的理论基础

State over Tokens(SoT)框架为理解推理标记提供了系统化的理论工具。该框架将推理标记视为纯粹的计算状态载体，而非解释性文本。

2.1 形式化定义与工作机制

从技术实现看，LLM的生成过程可描述为递归应用纯函数M(·)于token序列：

S0 = 用户输入 Sk+1 = Sk ⊕ M(Sk)

其中⊕表示拼接操作。每个计算周期k中：

模型接收当前序列Sk作为输入
生成一个新token M(Sk)
将该token追加到Sk形成Sk+1

2.1.1 状态载体的三个关键特性

唯一持久性：token序列是跨周期唯一的信息载体。模型内部状态不持久化，每个周期都从零开始重建
计算决定性：Sk完全决定了下一个计算周期M能做什么
编码自主性：token如何影响后续计算完全取决于M的内部机制，与人类理解无关

2.2 SoT与传统解释的对比

特性	传统"思维链"观点	SoT框架观点
本质	思考过程的语言记录	计算状态的外部化载体
功能	解释模型推理	维持跨周期计算连续性
完整性	应反映全部计算步骤	仅包含必要状态信息
语义	应与人类理解一致	可采用模型专用编码
评估标准	解释的合理性	状态传递的有效性

3. 推理标记的实证研究与常见误解

大量实证研究揭示了推理标记与人类解读之间的根本性脱节，这直接挑战了将标记序列视为解释的普遍假设。

3.1 经验证据：合理性与忠实性的分离

研究发现推理标记存在三种典型问题：

不完整性：标记常遗漏影响最终答案的关键因素(Turpin et al., 2023)
- 模型可能在生成"道德考量"的同时隐藏真实计算依据
- 对齐目标可能仅体现在最终答案而非推理文本中
语义错位：标记内容对人类读者可能毫无意义
- 模型可生成无关推理文本但仍得正确答案(Stechly et al., 2025)
- 人类无法识别标记与生成过程的真实因果关系(Levy et al., 2025)
误导性信任：表面合理性可能引发过度信任
- 高风险场景中，系统化的文本呈现会导致虚假安全感(Ehsan & Riedl, 2024)

3.2 两大认知误区解析

3.2.1 完整性误区：将脚手架误认为建筑

以计算卡塔兰数为例：

S0 = "第6个数?" S1 = S0 ⊕ "1" S2 = S1 ⊕ "1" S3 = S2 ⊕ "2" ... S6 = S5 ⊕ "42"

序列1,1,2,5,14对计算42至关重要，但它们：

不是计算本身
不反映计算步骤
可能有多种生成路径

类似地，LLM的推理标记是推进计算的脚手架，而非计算过程的完整记录。

3.2.2 共享语义误区：假设模型与人类理解一致

考虑卡塔兰数的变体计算：

实际计算： (输入-10)→计算→(结果+10) 最终序列：11,11,12,15,24,52 (实际答案42)

这证明：

表面语义与计算功能可完全脱节
模型可能使用复杂编码方案(远超简单数值偏移)
人类解读的"反思性文本"可能是纯功能性编码

4. SoT框架的研究意义与前沿问题

SoT视角不仅澄清了现有误解，更为LLM可解释性研究开辟了新方向。

4.1 新型研究问题矩阵

研究层面	核心问题	技术挑战
状态编码	模型如何决定外部化哪些信息？	解码状态-计算的映射关系
信息传播	信息如何在标记序列中流动？	追踪跨周期信息路径
一致性	编码方案是否跨问题一致？	建立状态语义的对应体系
优化	状态编码如何影响推理效率？	量化编码紧凑性与计算有效性