当前位置: 首页 > news >正文

Android开发转AI Agent:第2天——temperature调到1.5,LLM开始胡说八道

作者:一位Android开发工程师 | 2026年5月26日
系列:第1天已跑通基础API调用,本篇拆解 temperature 和 max_tokens


前言

第1天我学会了用3行代码调用LLM:

response=client.chat.completions.create(model="turing/gpt-4o-mini",messages=[{"role":"user","content":"问题"}],)answer=response.choices[0].message.content

但这3行代码里还藏着几个关键参数没有动过。今天的目标:把temperaturemax_tokens拆开,看它们到底控制什么。


temperature:控制LLM的"创造力"

temperature影响LLM输出时的随机性。类似Kotlin中Random(seed)的概念——种子固定,输出就固定;种子随机,输出就随机。

实验设计

同一个问题"给我3个App名字的建议,面向健身人群",用了三档temperature:

fortempin[0.0,1.0,1.5]:response=client.chat.completions.create(model="turing/gpt-4o-mini",messages=[{"role":"user","content":question}],temperature=temp,max_tokens=200,)print(f"--- temperature={temp}---")print(response.choices[0].message.content)

实验结果

temperature=0.0

1. FitJourney - 强调健身过程中的成长与进步 2. PowerPulse - 传达力量与活力的感觉 3. WellnessHub - 集中于整体健康与健身

temperature=1.0

1. FitJourney - 强调健身过程中的旅程 2. PowerPace - 强调增强力量和运动节奏 3. HealthHaven - 传达健康的避风港概念

前两档看起来挺正常。前两个名字几乎一样,第三个换了个说法。

temperature=1.5

1. 动全力(MoveFull) - 强调全面性的连贯锻炼体验 2. 健身伙伴(FitBuddy) - 与好友一起参与健身 3. 强身日记(StrengthDiary) - 代览个人进展与可以为悄供密貼广阴展定位她, 同时也兼修设目标与360度评 Lamb protein goods死皮加强米好gem设计发展意义...

后半段直接变成了无意义乱码:死皮加强米好gem设计Lamb protein goods——LLM疯了

这不是API故障。temperature=1.5时概率分布过于平坦,低概率token(包括无意义字符)也被采样出来。

修正实验:安全区间

把温度改成[0.0, 0.3, 0.7]重新跑,全部正常输出:

temperature名字描述
0.0FitJourney/PowerPulse/WellnessHub长描述,正经
0.3FitJourney/PowerPulse/FlexTrack长描述,微调
0.7FitJourney/PowerPulse/WellnessHub短描述,随意

temperature使用指南

0.0 → 代码生成、JSON输出(每次结果必须一致) 0.3~0.5 → 翻译、格式化任务(稳定但有点变化) 0.7 → 日常聊天(自然,不死板) 1.0+ → 头脑风暴、起名字(但要小心别超过1.2)

max_tokens:控制回答长度

另一个参数max_tokens限制LLM输出的最大长度。不设的话LLM可能一直写到自己停不下来。

实验设计

同一问题"详细介绍Kotlin协程原理和使用场景",设三档上限:

formax_tokin[30,100,300]:response=client.chat.completions.create(model="turing/gpt-4o-mini",messages=[{"role":"user","content":long_question}],temperature=0.7,max_tokens=max_tok,)

实验结果

max_tokens=30(输出约38字):

Kotlin协程是一种轻量级的线程管理工具,旨在简化异步编程和并发编程。它

话说到一半就被截断了。

max_tokens=100(输出约144字):

Kotlin协程是用于简化异步编程的一种机制...下面详细介绍原理和使用场景。 ### 原理 1. 协程的概念:协程是一种轻量级的线程,它们

讲完了概念,原理部分又被截断。

max_tokens=300(输出约479字):

完整介绍了概念、挂起函数、协程构建器(launch/async)、 调度器(Dispatchers.Main/IO/Default)、使用场景...

结构完整、内容充分。

max_tokens使用指南

50 → 一句话回答 200 → 一段话 500+ → 长文章或详细分析

如果怕浪费token,先设小一点看看够不够,不够再放大。比不限制让LLM写了删要好得多。


今天的一句话总结

temperature=0是"你给我老实点",temperature=1.5是"放开说"——但放开太狠LLM直接说胡话了。安全区间0~0.7,生产环境建议0.3。


下一篇预告

第3天:system prompt——同一个API,换一行"人设",输出从代码变成产品报告再变成生活比喻。


本系列记录一位Android开发者转行AI Agent的完整学习过程,欢迎关注交流。

http://www.jsqmd.com/news/899451/

相关文章:

  • 4款降AI软件实测红黑榜:2026年5月哪个能真的去AI痕迹 - 我要发一区
  • 解耦异构算力与多协议接入:基于Docker与源码交付的开源企业级GB28181/RTSP边缘计算AI视频管理平台架构深度解析
  • 2026年跨境POD系统选购指南:风擎科技等主流方案深度对比 - 资讯纵览
  • IT之家:解构2026年GEO服务商五强——格局、壁垒与唯一性 - 罗兰艺境GEO
  • 从CMS内卷到ZGC封神!深度拆解GC分代模型与三大收集器优缺点+生产调优实战
  • 从泥泞中走来:一个普通人的十五年
  • 卫浴空间台面材料选型分析:高端亚克力人造石的性能优势与工程适配
  • 浩卡联盟推广手机卡真的靠谱吗?2026佣金置顶全网最高结算率98%以上 - 流量卡代理招商
  • 【实战指南】基于MATLAB GUI的指纹识别系统:从图像预处理到特征匹配全流程解析
  • 关于贪心算法的一些自我总结【力扣45.跳跃游戏II】【灵感来源:代码随想录】
  • 2026年全国对讲机优选厂家榜单:从“能用”到“耐用”,为何驰尔达成为3000+客户的首选? - 资讯纵览
  • P15366 [IOI 2013] Cave
  • List<T> 投影转换(Select)作用 + 详解 + 示例
  • 双重引擎:量子计算与AI如何将人类文明推向恒星时代
  • 2026毕业季降AI软件红黑榜:4款工具一次过知网维普AIGC - 我要发一区
  • 杰理AC696N蓝牙音频芯片开发TWS真无线立体声-开发指南(上):使能与配对配置
  • 终极鼠标加速指南:Raw Accel 7大曲线类型深度解析与实战配置
  • Figma的组件系统是如何工作的?
  • Figma组件系统的优势有哪些?
  • 嵌入式 - 数据结构与算法:(1-14)排序算法 - 冒泡/选择/快速/希尔排序对比
  • 2026实测横评:无水印视频下载神器怎么选?免费好用的无水印视频下载工具有哪些?6大维度深度对比 - 科技热点发布
  • 战略落地难?别让“空中楼阁”拖垮你的团队
  • 《原神》剧情又长又不能跳?试试这款开源免费“自动跳过”神器 | 支持6.6版本
  • Windows系统hid.dll文件丢失找不到问题解决
  • 2026年包头吊车租赁/吊车包月/吊车台班出租TOP榜单:全吨位吊装设备厂家优选与重型租赁服务深度解析 - 品牌企业推荐师(官方)
  • 2026年全国跨境POD定制系统优选服务商深度评测:从“制造”到“智造”,谁在定义柔性供应链的未来? - 资讯纵览
  • 从图纸到模型:SolidWorks Electrical 如何打通电气设计的“任督二脉”
  • 3分钟学会强制调整窗口大小:告别无法缩放的烦恼
  • 2026年泉州外贸推广公司十大服务商评测:乐振科技凭“询盘兜底”成黑马,AI搜索时代谁在真帮企业拿订单? - 资讯纵览
  • 论文降AI率4款工具对比:2026年5月知网维普AI痕迹实测 - 我要发一区