当前位置: 首页 > news >正文

LLAMA 配置AI大模型参数 --temp、--top-p、--top-k

温度(非常重要)

–temp/–temperature:0 ~ 1.0(确定性 ~ 创造性


参数作用典型取值范围
–temp(temperature)对概率分布进行“缩放”。
temp<1 → 高概率 token 更突出(更确定),temp>1 → 概率更平缓(更随机)。
0.0 ~ 2.0
–top-p(nucleus sampling)从概率累积和达到 p 的最小 token 集合中采样(如 p=0.9 → 只考虑概率最高的、累计占 90% 的 token)。0.8 ~ 1.0
–top-k只保留概率最高的k个 token,其余丢弃。1 ~ 100

重要交互

  • top_k=1时,强制选择概率最高的 token,此时temptop_p都无效。
  • 通常top_k用于初步裁剪(如 40~60),再配合top_ptemp进行采样。
  • temp=0也等价于贪心(总是选最高概率 token),但某些实现不允许 0,可用--temp 0.0或极小的值。

需求temptop-ptop-k备注
每次答案一模一样0.01.00*--top-k 1
安全、稳定、少跑偏0.30.8530适合敏感内容
日常对话(平衡)0.70.940多数情况的最佳起点
创意写作1.00.9560--repeat-penalty 1.1
完全无限制(极随机)1.51.00*可能输出无意义内容

*top-k=0或未设置表示不进行 top-k 剪裁;top-p=1.0表示不进行核采样。

http://www.jsqmd.com/news/767028/

相关文章:

  • 基于GitHub Actions自动化构建团队技能矩阵:从原理到实战部署
  • 从混乱到专业:5分钟用LaTeX的booktabs和multirow打造期刊级三线表与复杂表格
  • 轻量级进程守护工具 openclaw-keep-alive 实战指南
  • 2026年番禺铭悦玉府全屋定制专业服务商如何选型指南
  • 从VGG、ResNet到DenseNet:在FER2013上跑个分,聊聊我为什么最终选了它
  • 【Docker 27低代码容器化实战手册】:27个生产级部署技巧,零基础3天上线首个低代码应用
  • 【Docker监控黄金法则】:20年运维专家亲授7大必监指标与实时告警配置实战
  • 动态容量MoE框架实现语音与音乐统一生成
  • 如何快速连接魔兽世界自定义服务器:Arctium启动器完全指南
  • 毕业季不熬夜:用百考通AI轻松搞定本科毕业论文
  • 仅花几十元用一年|2026 实测智在记录 AI 会议纪要,每月省 20 + 小时,年省上千块
  • 从‘拖拉机油门’到平稳控制:在Python/Matlab里仿真PID积分饱和与抗饱和设计
  • TInyML基础:“不用死记公式!一文讲透全连接层:它到底把神经网络‘连’成了什么样?”
  • 农业物联网插件安全审计必做清单,VSCode 2026新增SAST扫描模块深度解析(仅限前500名下载CVE-2026-Agri补丁)
  • LeetCode 基本计算器题解
  • 如何实现Cursor Pro永久免费使用:完整技术指南
  • 凿岩机械臂力传感与运动控制轨迹规划【附代码】
  • MCP协议:构建AI智能体与外部工具的安全标准化桥梁
  • 缠论可视化终极指南:如何在通达信中快速部署免费分析插件
  • 2026年免费查论文AI率3个正规渠道,附降到15%以下完整教程
  • 视觉语言模型鲁棒性提升:ArtiAgent伪影生成技术解析
  • 如何高效使用PE-bear进行PE文件逆向分析:实用指南
  • 第31集:大模型容错架构!当 LLM 超时/幻觉/被限流时的降级与兜底方案
  • 网盘直链下载终极解决方案:全平台免费高速下载的完整指南
  • 无人热干面餐厅服务机器人抓取策略深度学习【附代码】
  • 5分钟搭建你的私人云游戏服务器:Sunshine游戏串流终极指南
  • 3分钟搞定视频字幕:VideoSrt开源工具完全指南
  • 航测新手避坑指南:用Metashape做DOM时,建筑物拉花、扭曲怎么解决?
  • React 18\+Next\.js 14实战:服务端渲染与跨端开发全指南
  • DOM 节点信息