当前位置: 首页 > news >正文

关闭 prompt caching 不是优化手段,而是一把调试用的手术刀

我今天在看 Claude Code 的缓存策略时,最容易被误用的一组参数,恰好不是开启缓存的参数,而是关闭缓存的参数。因为很多性能问题看起来都像缓存问题,模型忽快忽慢,/cost里的 token 数字忽高忽低,切到 Bedrock、Vertex、Foundry 或内部网关之后,缓存命中又变得不稳定。这个时候,我们很容易下意识地想把缓存关掉,觉得这样结果更干净。但在 Claude Code 的真实工作流里,关闭 prompt caching 更像是调试用的隔离开关,而不是日常开发里的性能优化按钮。

Claude Code 官方环境变量文档明确列出了一组开关,DISABLE_PROMPT_CACHING可以对所有模型关闭 prompt caching,而DISABLE_PROMPT_CACHING_HAIKUDISABLE_PROMPT_CACHING_SONNETDISABLE_PROMPT_CACHING_OPUSDISABLE_PROMPT_CACHING_FABLE则分别只影响对应模型系列。官方文档还写得很清楚,DISABLE_PROMPT_CACHING的优先级高于这些按模型粒度设置的变量。也就是说,一旦全局开关被设为1,再单独讨论 Sonnet、Haiku、Opus 或 Fable 是否缓存,就没有意义了。(

http://www.jsqmd.com/news/1119230/

相关文章:

  • 第一章 多相流基础(三)---连续介质假设
  • 运维踩坑实录:服务器 WAF 完好无损,官网却被植入黑产脚本,我找到了被忽略的攻击入口
  • HCI 功能规范【3. Overview of commands and events】
  • 终极解决方案:用d2dx让经典暗黑2在现代PC上焕然一新![特殊字符]
  • Path-specific rules,Claude Code 大型项目里的按路径装配术
  • 青拔申报全套服务丨文案逻辑梳理+高端PPT设计
  • 把设计规范写成代码格式,是所有 AI 工具的上游约束方法论
  • 在 MATLAB 中进行积分结构函数的计算,通常需要处理从实验测得的瞬态温度曲线 $T_j(t)$ 到热阻抗曲线 $Z_{th}(t)$,再通过反卷积(Deconvolution)获得连续时间常数谱
  • 具身智能的“ChatGPT时刻”:TVA技术演进与前景展望(系列)
  • Claude Opus-4-7深度评测:科研级长上下文与跨模态推理实战指南
  • Linux---动静态库的加载与链接
  • 教培机构小程序开发工具测评:餐宝盈/BBWEYY/比文云/Typedream/Notion Sites(2026年7月更新)含零代码SAAS、AI编程、源码定制交付
  • 近期Gmail账户劫持攻击高发!广告主需及时完成安全加固
  • unity-子状态机
  • OpenBMC:D-Bus的概念、作用与功能示例
  • 把 CLAUDE.md 当成项目里的第二份 README
  • LLM对齐算法 - PPO / DPO / GRPO / Online DPO / KTO / IPO / ORPO / SimPO
  • Java搜索代码写成这样?框架绕成毛线团,数据库哭晕在厕所
  • 家用iPad多人共用怕证件泄露?这款本地加密工具,一人一套独立加密空间
  • 终极GitHub Desktop汉化指南:三分钟让英文界面变中文
  • 豆包表格复制到 Word 只剩 | 和 --- 怎么办:Markdown 表格转 docx 实操
  • 【2026硬核安全】万字深潜:12大网络攻击技术底层原理与防御实战全解
  • SmokePing主从架构完整指南:分布式网络监控实战教程
  • TREZOR硬件钱包安全漏洞修复与主动防御实战指南
  • Linux 运维高频故障排查手册(CPU/内存/磁盘/网络/端口/进程一套打通)
  • 【安全架构师必修】拒绝纸上谈兵!六大网络安全模型深度拆解与2026实战落地指南
  • (论文速读)基于扩散模型潜变量的旋转机械健康监测与早期故障检测方法
  • unity-shader-Tags渲染标签
  • Skill自进化:下一代 Agent产品的核心竞争力
  • 多模态大模型本地部署(Qwen2.5-VL-7B-Instruct)