当前位置: 首页 > news >正文

大模型思维链(CoT)理论梳理

目录

  • 一、什么是思维链?
  • 二、用来干什么
  • 三、发展脉络
  • 四、如何开启推理
    • 4.1 普通模型:提示词工程
    • 4.2 推理模型:默认开启,不可关闭
    • 4.3 当代模型:可开关的思考模式
  • 五、总结

一、什么是思维链?

一句话总结,思维链(Chain of Thought,CoT),它是一种提示工程技术——引导大模型在给出最终答案之前,先输出一系列中间推理步骤。
是由Goolge在2022年1月提出的
思维链并没有给大模型增加任何新功能,而是激活大模型本来就有的潜能,不让其跳过中间推理步骤,而是将输出的推理过程作为新的推理前文,逐步逼近答案。

类比做数学题,是直接给出答案,还是一步步写出中间过程,最后算出答案,肯定是后者的正确率高

二、用来干什么

核心用途是提升大模型在需要多步推理的复杂任务上的表现。具体来说:

  1. 分解复杂任务:模型将复杂问题拆解为更小、更易于管理的子任务,依次解决。
  2. 减少推理错误:分步推导降低了“一步到位”时常见的逻辑跳跃错误。
  3. 提高可解释性:用户可以看到模型的推理逻辑,便于调试和建立信任。
  4. 便于纠错:当中间步骤出错时,可以精准定位问题所在,而不是面对一个“黑箱答案”无从下手。

三、发展脉络

  1. 2022年 发现思维链的存在,利用提示词工程,激活思维链
  2. 2024年 推理模型兴起,通过大规模强化学习将思维链能力内化到模型内部,模型强制自动推理,不需要提示词激活。代表模型DeepSeek R1
  3. 2026年,推理能力(思考模式)”已是一项内置的核心功能,模型不再强制推理
    可以选择是否开启推理,以及推理强度。代表模型deepseek-v4-pro
    甚至有的模型可以自动决定是否开启思考模式(自适应思考),代表模型caude 4.8 和 chatGpt 5.5

四、如何开启推理

4.1 普通模型:提示词工程

推理能力完全依赖提示词工程来激活,代表模型deepseek-v3,本地部署轻量模型等

开启方式:

  • 零样本思维链(Zero-Shot CoT) :在问题后直接添加触发短语,如“让我们一步步思考“”。模型会据此输出推理步骤。
  • 少样本思维链(Few-Shot CoT) :在提示中提供2-8个带有完整推理步骤的示例,让模型模仿。

思考内容的存放位置:
没有独立的“思考”字段。模型输出的推理过程和最终答案全部混在 content 字段中

4.2 推理模型:默认开启,不可关闭

模型将推理能力内置,强制推理,无需提示词唤醒。代表模型:deepseek-r1

思考内容的存放位置:
推理模型将思维链(推理过程)和最终答案分开存放,通过两个独立的字段返回。

字段内容
reasoning_content思维链——模型的内部推理过程
content最终答案
reasoning=response.choices[0].message.reasoning_content answer=response.choices[0].message.content

4.3 当代模型:可开关的思考模式

模型同时具备“直接回答”和“深度思考”两种模式,通过API参数动态切换。代表模型DeepSeek V4 Pro、GPT-5系列

开启方式:
通过 thinking.type 等参数控制思考模式的开关

fromopenaiimportOpenAI client=OpenAI(api_key="<你的API Key>",base_url="https://api.deepseek.com")response=client.chat.completions.create(model="deepseek-v4-pro",messages=[{"role":"user","content":"9.11和9.8哪个更大?"}],# 开启思考模式(必须放在 extra_body 中)extra_body={"thinking":{"type":"enabled"}},# 或 "disabled" 关闭# 可选:控制思考强度reasoning_effort="high"# 可选 high / max)

思考强度控制:
当代模型还支持通过 reasoning_effort 参数控制思考的“深度”

参数值含义
minimal / low轻量思考,响应快,Token少
medium中等思考(默认)
high / max深度思考,准确性高,耗时和Token更多

思考内容的存放位置:
与推理模型一致,思维链通过 reasoning_content 返回,最终答案通过 content 返回

五、总结

维度普通模型推理模型当代模型
代表模型GPT-4、Claude 3DeepSeek R1、OpenAI o1DeepSeek V4 Pro、Claude 3.7、GPT-5
推理开启方式提示词引导默认开启,不可关闭thinking.type 开关控制
思考强度控制reasoning_effort 参数
思考内容字段混在 content 中reasoning_contentreasoning_content
是否可关闭不开启就没有不可关闭可关闭

从普通模型到当代模型,我们看到一条清晰的演进路径:推理从“提示词技巧”进化为“内置默认行为”,再进化为“可精细调控的开关” 。不变的是,无论哪种方式,思维链的本质都是让模型不跳过中间的推理过程——只是实现方式越来越优雅、越来越可控

http://www.jsqmd.com/news/1096957/

相关文章:

  • 电路设计实战:电源防反接、光耦与磁耦隔离的选型与应用解析
  • PCB布线禁忌再思考:直角与锐角走线的真实影响与设计权衡
  • 性价比高的免费降英文AI工具效果如何
  • 迈向工业异常检测的全面召回:PatchCore核心思想与实践解析
  • 校易淘实训|Vue3+SpringBoot+MySQL 前后端分离项目从零搭建完整流程 + 全套踩坑解决方案
  • Three.js 简单碰撞检测教程
  • 告别安卓模拟器:3分钟学会在Windows上直接安装APK应用
  • 3分钟掌握Resemble Enhance:终极AI语音降噪增强神器
  • Spring Boot 与 Solon 比较,相互迁移实战指南
  • Cadence Allegro PCB Designer实战:从零到一绘制标准PCB封装
  • qrcode.vue:Vue生态中的专业二维码生成解决方案
  • Parsedown终极指南:3步打造高效Markdown解析工作流
  • 杨洋亮相青岛啤酒“白啤更懂夏的嗨”派对 共赴夏日之约
  • Kazumi番剧播放器:如何通过插件扩展实现全网动漫自由观看
  • 【全网最详细】Sucrose Wallpaper Engine下载免费版 动态桌面壁纸软件安装图解(2026最新)
  • 从Wireshark到NpCap:动手构建网络协议解析与流量监控工具
  • ArkTS常用组件知识点整理
  • AGGrid自定义cellRenderer下tooltipShowMode不生效如何处理?
  • 3步搞定艾尔登法环存档管理:终极角色迁移方案
  • Multisim14丨界面布局异常恢复丨实战排查指南
  • 从零到一:基于STM8的125KHz RFID读卡器实现与曼彻斯特码解析实战
  • ORBSLAM3实战:手把手教你将KITTI数据集适配VIO/IMU模式,并完成精度评估
  • OpenAI API 0613更新深度解析:从GPT-3.5-turbo-16k到函数调用的实战指南
  • 红帽 Linux 零基础完整学习笔记 5
  • 从跑分到洞察:CPU性能评估工具全解析与实战指南
  • Yahoo Finance API:.NET开发者的金融数据革命性解决方案
  • 从编译产物到智能索引:详解gen_compile_commands.py生成compile_commands.json的实战路径
  • 从理论到实践:积极心理学与情绪智慧如何赋能研究生科研与生活
  • 深度解析Untrunc:开源视频修复工具的技术实现与实战应用
  • Python量化交易数据获取的终极解决方案:efinance免费金融数据库完全指南