当前位置: 首页 > news >正文

2.5 采样策略完全指南:温度、top-p、思维链、结构化输出实战

采样策略完全指南:温度、top-p、思维链、结构化输出实战

从概率生成到可控输出,让大模型输出更稳定、更可用。本节基于《AI工程》第2章「Sampling」— Sampling Fundamentals、Sampling Strategies、Test Time Compute、Structured Outputs、The Probabilistic Nature of AI。

一、采样的本质

Chip Huyen 在《AI工程》第2章将采样(Sampling)列为理解基础模型的核心维度。大模型输出是概率分布上的采样。下一个 token 不是唯一答案,而是一组候选及其概率。采样策略决定了如何在候选中选择,从而影响输出的随机性、多样性、稳定性。

书中强调,理解采样的概率本质,是理解幻觉输出不确定性的根源。本节系统对应书中五个小节:采样基础、采样策略、测试时计算、结构化输出、AI 的概率本质。


二、基础参数:温度(Temperature)

2.1 原理

softmax(zi/T)\text{softmax}(z_i / T)softmax(zi/T)

  • T = 1:保持原始概率
  • T > 1:分布更平滑,输出更随机
  • T < 1:分布更尖锐,输出更确定
  • T = 0:等价于贪心,选概率最高的 token

2.2 场景选择

温度
http://www.jsqmd.com/news/377422/

相关文章:

  • 2.3 模型规模与性能的权衡:参数、上下文、算力全攻略
  • 分期乐购物额度怎么提出来?简单三步快速上手! - 团团收购物卡回收
  • Visual Studio 2026 Enterprise 18.3.0 Offline (2026 年 2 月更新)
  • 2.4 后训练技术:SFT与RLHF从原理到实战
  • 【计算机基础】-46-“用合适的工具做合适的事” —— 通用场景用 Small Memory, 实时关键场景用 不同size的Memory Pool, 内核对象用 Slab, 大内存用 Buddy。
  • ArkUI框架运行原理与常见性能优化方案
  • Apache Cassandra Connector Flink 与宽列存储的高吞吐协作 - 实践
  • 完整教程:【低空经济】低空经济智能制造基地建设方案
  • AI 画图全家桶来了!这回想自己手绘图都难了
  • 专业检测背书,标准引领品质——独语N627-1领跑学生护眼市场 - 资讯焦点
  • setupldr源代码分析之得到SetupDevice和打开文件txtsetup.sif和biosinfo.inf
  • 买中宁枸杞选哪个品牌?玺赞深耕十年,用道地品质筑牢口碑标杆 - 宁夏壹山网络
  • 计算机毕业设计Python+Django微博舆情分析系统 微博舆情预测 微博爬虫 微博大数 据(源码+LW文档+PPT+详细讲解)
  • 【深度解析】某水务集团“十五五“数据资产化战略:构建水务数据资产与水权交易双轮驱动的数字化新生态(WORD)
  • 1.1 从语言模型到LLM:万字详解大模型演进史
  • 洗碗粉(洗碗机清洁剂)市场细分观察:安全、效能与场景驱动的品牌分化
  • 2026选新型高清印刷机定制厂家,这份排行分析别错过,市场高清印刷机怎么选购精选实力品牌 - 品牌推荐师
  • 10.3 实战 多Agent协作完成一个复杂项目
  • 1.2 基础模型究竟是什么?一文搞懂AI工程核心概念
  • 【信息科学与工程学】【解决方案体系】光刻机
  • 我论文写得太像人了,结果系统说:你不是人??
  • $k$ 边最短路-矩乘
  • Linux随记
  • 你认真写下的每一个字,都值得被相信 ✨
  • 大润发购物卡快速变现攻略 - 团团收购物卡回收
  • SharePoint Online 网站配置时区
  • 河北粘钉一体机厂家2026年推荐榜,品质与口碑并存,河北粘钉一体机公司哪个好解决方案与实力解析 - 品牌推荐师
  • 大模型“涌现能力”的来源解析
  • 开题总被退回?试试百考通AI——专业、规范、0代写风险!
  • 2026年大型集团资产管理系统软件哪家好?资产管理系统平台推荐 - 品牌2025