当前位置: 首页 > news >正文

大模型---温度与其他采样方法

目录

1.温度的定义

2.温度和top-k、top-p的关系


参考论文:1904.09751

1.温度的定义

温度是模型解码阶段的一个采样参数:模型先为下一个 token 计算一组logits(大小为词表大小,logit表示词表中每个token的分数),再用温度把这组 logits 重新缩放,最后通过 softmax 得到新的采样分布。下面公式:

也就是说,模型本来先算出一组logits,温度不是改模型参数,而是改这组 logits 再进 softmax 的方式。

当t=1,分布不变,就是普通softmax。
当t<1,比如t=0.5,相当于把所有logit放大一倍。这样大的logit会变得更大,小的logit会变得更小,softmax后分布会更尖锐,头部token更占优势。
当t>1,比如t=2,相当于把所有logit缩小。这样各token之间差距会被压平,分布更平坦,低概率token更容易被采样到。

语言模型每一步都在“从一个分布里选下一个 token”。如果降低温度,低温会进一步偏向这些高概率token,所以生成结果通常更流畅、更少离谱错误,但也更容易模板化、保守甚至重复;如果升高温度,允许次优 token 有更大机会被采样,模型就更可能出现不同措辞、不同句法、不同展开路径。所以可以这样总结,高温更有创

http://www.jsqmd.com/news/712753/

相关文章:

  • Python Pickle安全风险解析与企业级防御方案
  • 告别Node版本混乱!保姆级NVM安装与配置教程(Windows版,含环境变量避坑)
  • RAG项目经历写作指南:让你的简历脱颖而出,收藏这份高薪秘籍!
  • 2026年3月保定有名的防浪石模具实力厂家推荐,检查井模具/风电基础模板/化粪池模具,防浪石模具直销厂家哪家好 - 品牌推荐师
  • 一次大规模 PDF 导出系统的工程复盘
  • DBeaver安装包
  • 【前端性能优化核心:防抖与节流实战指南】
  • 【限时技术解禁】:Docker+WASM双Runtime热切换机制(附GitHub Star 1.2k的私有仓库迁移脚本)
  • 融合CBAM混合域注意力的YOLOv10小目标检测:原理详解与完整代码实现
  • 2024年华数杯数学建模C题老外游中国解题全过程文档及程序
  • Flink 系列第19篇:深入理解 Flink SQL 的时间语义与时区处理:从原理到实战
  • 优刻得星图AstraFlow首发上线DeepSeek-V4,性能比肩顶级闭源模型
  • 2026年北京做中央空调安装的优质供应商排名,看看有哪些 - 工业设备
  • Service-as-a-Software 如何让 solo operator 悄然跑出软件级营收与毛利
  • 小白也能用的CosyVoice2声音克隆:5分钟搭建个人语音助手
  • 2026年北京口碑好的暖通服务商排名,合泰嘉业的服务值得一提吗 - 工业设备
  • Phi-4-mini-flash-reasoning入门必看:轻量级文本推理模型快速上手指南
  • 分析宁波工作服推荐几家,性价比高的厂商有哪些 - 工业品牌热点
  • 构建具备长期记忆能力的 AI Agent Harness Engineering 指南
  • 解析GPUDirect RDMA及类似技术
  • 云容笔谈·东方红颜影像生成系统开箱即用体验:十分钟内生成你的第一张国风画作
  • 收藏!Java程序员如何通过学习AI智能体实现年薪翻倍,职业华丽转身!
  • 2026年全国专业除甲醛公司哪家便宜,性价比高的怎么选 - 工业推荐榜
  • 【技术底稿 25】日志说入库成功了,但 Milvus 里没有?——一次“假成功”背后的配置与注入排查实录
  • 2026年AI配图神器GPT-Image-2震撼发布
  • [Windows] 知识库 Knowledge Base v1.1.0
  • 2026年3月分析仪供应商推荐,手持光谱仪/奥林巴斯手持光谱仪/贵金属分析仪/金属材料分析仪,分析仪厂商口碑推荐 - 品牌推荐师
  • 为什么93%的SOC团队在MCP 2026中漏掉了横向移动链路?——红队验证的3层隐蔽资产识别法
  • LSTM计算过程
  • 2026年法奇奥售后保障完善吗,苏州智能制造服务费用多少 - 工业推荐榜