当前位置: 首页 > news >正文

模型训练过程中会设置topkp和温度吗?

模型训练过程中会设置topkp和温度吗? no

目录

    • 模型训练过程中会设置topkp和温度吗? no
      • 结论
      • 为什么训练阶段不需要这些参数
      • 三个参数在推理阶段的作用

结论

top_ktop_p(核采样)和temperature(温度)都属于文本生成解码阶段的采样参数,两个阶段的情况如下:

  1. 推理(生成)阶段:是核心可调参数,几乎所有生成场景都会设置或使用默认值,用来控制输出文本的随机性、多样性和确定性。
  2. 训练(参数更新)阶段常规的预训练、监督微调(SFT)都不会设置,它们不参与模型参数的学习与更新。

为什么训练阶段不需要这些参数

大语言模型的常规训练(预训练、SFT)基于最大似然估计(MLE),采用教师强制(Teacher Forcing)模式,目标是让模型在给定上文时,最大化“正确下一个token”的预测概率:

  • 训练时每一步的“标准答案”(下一个token)是已知的(来自训练语料)。
  • 模型只需要输出所有token的概率分布,然后计算该分布与真实标签的交叉熵损失,再反向传播更新参数。
  • 整个过程不需要执行“从概率分布里挑选一个token”的采样动作,而top_ktop_ptemperature恰恰只作用于这个采样环节,因此训练阶段无需设置。

http://www.jsqmd.com/news/1071671/

相关文章:

  • 汽车LIN系统基础芯片(SBC)选型、设计与应用实战
  • AVR单片机JTAG与边界扫描技术:从原理到硬件调试实战
  • 什么云手机适合普通人?实测两款不掉线卡顿的好用云手机
  • FPGA硬件加速DDS通信:原理、架构与软硬协同实现
  • 蓝牙串口适配器实战:FireFly三模式组网与工业无线通信优化
  • 从 HIPify 到 SGLang,我的一套 AMD 大模型落地流水线
  • Java后端转大模型:我用Spring AI + LangChain4j两周搞定,老板直接加薪
  • BM70/71蓝牙5.0模块开发实战:从集成优势到低功耗物联网应用
  • 多租户 RAG 知识库权限怎么隔离
  • [特殊字符]《天堂2:盟约》公测上线!打工人也能摸鱼冲级?
  • MPLAB Harmony加密库SHA-2实战:硬件加速、内存管理与安全应用
  • Microsemi FPGA电源设计:DC-DC与LDO选型、计算与PCB布局实战
  • Directus:给任意 SQL 数据库套上 API 和管理后台
  • 不用 NVIDIA 也能搞分布式训练,RCCL 多卡通信实测
  • MPLAB X CI/CD Wizard实战:嵌入式开发自动化构建与单元测试
  • 从芯片到系统:基于Microchip BB15L61A霍尔传感器的评估与应用实战
  • AT21CSMK100单线EEPROM评估套件实战:从硬件连接到固件开发
  • AT42QT2160电容触摸传感器:从电荷转移到矩阵扫描的硬件设计与调试指南
  • Atmel CryptoAuthentication评估套件实战:从硬件加密到安全协议集成
  • MPLAB Harmony BSP:嵌入式开发的硬件抽象与快速原型利器
  • FPGA高速串行通信:8b10b编码与CorePCS IP核原理与调试实战
  • CoreABC NVM模式配置实战:APB总线访问Flash指令存储详解
  • AVR单片机ISP编程实战:修复汽车智能钥匙RKE/PKE系统故障
  • 基于PIC16F1779 CIP的数字电源开发:从硬件配置到PID控制实战
  • 软件融合管理中的技术创新应用
  • 音乐后期处理AI工具
  • 萍乡除甲醛哪家机构靠谱
  • 回文(赵子泰2547102142)
  • 国家授时网络:从GNSS依赖到自主高精度时间体系的构建与实践
  • ATtiny88低功耗设计实战:从睡眠模式到纳安级待机电流优化