当前位置: 首页 > news >正文

大模型---COT思维链,TOT思维树,GOT思维图

目录

1.COT思维链

(1)Auto-CoT

(2)Self-Consistency

(3)Least-to-Most

2.ToT

3.GoT

4.总结


幻觉相关综述通常把问题分成两大类:一类是事实性幻觉,也就是与客观事实不一致;另一类是忠实性/一致性问题,也就是输出和输入、上下文、约束条件不一致。很多“推理增强”方法主要首先改善的是后者:让模型别跳步、别漏条件、别在中间步骤里乱走。COT/TOT/GOT这类方法是在给 LLM 增加“中间推理结构”或“中间决策机制”,从而减少一次性直出答案带来的跳步和错误传播。

1.COT思维链

CoT的定义参考下面论文:[2201.11903] Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

通过在提示中给出中间推理步骤,显著提升大模型在算术、常识和符号推理任务上的表现。这种能力在足够大的模型上更容易被激发出来。

CoT有两个层面:

① 格式层面:让模型输出步骤,也就是Few-shot CoT,给几个“题目 + 中间推理链 + 答案”的示例,模型模仿这种形式继续答题。

② 诱导层面:让模型进入“先推理再回答”的行为模式,也就是Zero-shot CoT,不提供具体样例,只加一句类似 “Let’s think step by step.” 下面这篇论文就证明了,光靠这种简单引导,也能显著提升多个推理基准上的表现。下图对比了Zero-Shot-CoT和Manual-CoT(Few-shot CoT),左图就是Zero-Shot-CoT,不提供具体样例,只告诉模型Let's think step by step,让模型通过自己生成的推理链生成答案;右图为Manual-CoT,不是让模型先自己生成一条reasoning chain,而是先给它看一个人工写好的CoT示例,再让它模仿这种格式去做新题。

[2205.11916] Large Language Models are Zero-Shot Reasoners

CoT写出来的reasoning chain(推理链),并不一定忠实反映模型真正得出答案的过程;换句话说,CoT提高了表现,但不保证这些中间步骤就是"真实机制的解释"。因此他们提出把问题先翻译成符号推理链,再交给确定性求解器执行,以提升"faithfuIness"。

(1)Auto-CoT

Auto-CoT解决的不是“CoT不会推理”,而是“Few-shot CoT 很依赖人工写示例”。Auto-CoT的核心思想是:先做问题聚类,再从每类中选代表问题,用 Zero-shot-CoT 自动生成 reasoning chain,从而构造 demons

http://www.jsqmd.com/news/579619/

相关文章:

  • OpenClaw调试秘籍:Qwen3.5-9B任务失败排查五步法
  • 企微API接口调用规范:如何用代码安全地群发?
  • Air8101:低功耗-WiFi-UI_SoC模组介绍
  • 2026年口碑好的景区面食餐馆/老字号面食餐馆/山西特色面食餐馆高评分推荐 - 品牌宣传支持者
  • SecGPT-14B模型缓存优化:加速OpenClaw频繁调用的响应速度
  • Graphormer部署案例:Kubernetes集群中Graphormer服务的HPA弹性伸缩
  • 基于深度强化学习的无人机自适应实时路径规划 该存储库主要实现了轻量级强化学习算法框架和用于实时...
  • ESPS USB MSC 调试全过程记录
  • 编写程序让智能鲜花保鲜液浓度检测,不达标提示“更换保鲜液”。
  • c#winForm向微信小程序订阅者发送消息
  • 面试题杂记
  • Nanbeige4.1-3B开源大模型:支持LoRA微调+QLoRA量化,低成本适配垂直领域
  • 2026年评价高的环链电动葫芦/南通洁净式电动葫芦/钢丝绳电动葫芦/南通电动葫芦公司选择指南 - 品牌宣传支持者
  • SEO 竞价推广的账户管理技巧有哪些
  • 科技中介机构如何提升服务的专业性与效率?
  • 2026最新降AI率工具测评:嘎嘎降AI、比话降AI、率零实测对比
  • EmbeddingGemma-300M快速体验:Web界面点点鼠标就能用
  • LingBot-Depth效果惊艳:遮挡区域深度补全自然度超越传统CRF方法
  • 观点:倒计时4年!Gartner重磅发布《2026网络安全6大趋势》,AI失控、量子威胁已逼近企业生命线
  • OpenClaw社区贡献指南:为Qwen3-14b_int4_awq开发并分享自定义技能
  • YOLOv13官版镜像入门:零基础5分钟搭建目标检测环境
  • SEO 关键词挖掘工具的数据准确性如何
  • 2026年热门的重型车空气悬挂/浙江商用车空气悬挂厂家哪家好 - 品牌宣传支持者
  • Qwen3.5-9B参数详解:temperature/top_p/top_k调优与效果对比
  • TypeScript编程03-枚举
  • Phi-4-mini-reasoning惊艳效果:同一逻辑题不同temperature输出对比
  • 效率提升:用快马ai加速openclaw在ubuntu上的抓取方案寻优与评估
  • OpenClaw安装部署Windows操作系统版 - 手把手教你搭建AI智能体平台
  • 2025第七届全球校园人工智能算法精英大赛:大规模SAR图像多类别有向目标检测算法赛题自己所训练模型结果如下:⬇️⬇️⬇️⬇️P是0.862,R是0.774,mAP是0.851模型测试推理结果如
  • 2026年比较好的改装空气悬挂/浙江商用车空气悬挂/汽车空气悬挂横向对比厂家推荐 - 品牌宣传支持者