当前位置: 首页 > news >正文

FORCE_PROMPT_CACHING_5M,Claude Code 缓存 TTL 的刹车踏板

正在排查缓存时,最怕的不是 miss,而是搞不清为什么 miss

Claude Code 的 prompt caching 很容易被误解成一个简单的开关,打开以后就会变快,关闭以后就会变慢。真正落到工程现场,问题通常没有这么干净。一次请求有没有命中缓存,不只取决于缓存有没有开启,还取决于前缀是否一致,模型是否一致,认证方式是什么,provider 是否支持对应能力,cache breakpoint 放在哪里,TTL 是否已经过期。更麻烦的是,Claude Code 会根据认证方式自动选择 TTL,所以同一套项目、同一段历史、同一个命令,在 Claude subscription、API key、Bedrock、Vertex AI、Foundry 这些环境里,缓存表现可能并不完全一样。

这里的关键变量就是FORCE_PROMPT_CACHING_5M=1。它不是用来关闭 prompt caching 的,也不是用来让 Claude Code 忘掉已有上下文的。它的作用更像一块刹车踏板,当环境里已经存在 1 小时 TTL 的倾向时,把后续 prompt cache TTL 强行拉回 5 分钟。Claude Code 官方文档明确写到,设置FORCE_PROMPT_CACHING_5M=1后,会不管当前使用什么认证方式,都强制使用 5 分钟 prompt cache TTL,并且会覆盖ENABLE_PROMPT_CACHING_1H。这个变量适合调试缓存行为、对比两种 TTL,或者在 managed settings 已经设置ENABLE_PROMPT_CACHING_1H

http://www.jsqmd.com/news/1123747/

相关文章:

  • 5个实用的Google Cloud Vision API示例项目详解
  • 个人分享|校园新闻网站源码与配套论文,课设毕设参考素材!
  • 黑苹果配置革命:OpCore Simplify - 自动化EFI生成终极解决方案
  • CTF Web安全入门:三个月系统学习路线与实战技巧
  • 解决Obsidian中嵌入Claude Code的问题
  • ICM-42688-P与PIC18LF27K42在工业振动监测中的优化应用
  • Lua 5.1字节码反编译终极指南:luadec51完整使用教程
  • 3. 应用编程---信号
  • 大模型能力对比:基于场景锚点的AI选型方法论
  • OpenCore Legacy Patcher完整指南:让老款Mac免费升级最新macOS的终极方案
  • Deepin Boot Maker终极指南:3步制作Linux启动盘的最佳实践
  • 林伽一 · AI科技日报 |LongCat-2.0宣称中国芯片突破,Claude Sonnet 5自报分数解析
  • ComfyUI-WanVideoWrapper实现AI视频生成性能突破:径向注意力与FP8量化技术深度解析
  • 终极指南:3分钟学会用FanControl掌控Windows电脑风扇,告别噪音烦恼
  • “写了十年代码,我才懂什么叫“一即一切“:分形几何×七境修心,一个程序员的自救指南
  • Linux高并发Reactor反应堆模式深度精讲,单Reactor、多Reactor架构、epoll高并发服务器手写、Nginx核心架构落地实战
  • Python cryptography库实战:RSA非对称加密与数字签名完整指南
  • 3分钟掌握Diablo Edit2:暗黑2存档修改器的终极解决方案
  • The Other Side of the Grail: Risks to the Mission System and the Complete Solution
  • 赋值操作符:=和复合赋值
  • 2026图片去水印怎么弄?无痕去水印实用技巧+免费工具手机电脑教程
  • 用 AI 写代码做家庭调酒小程序:真正难的是把酒库到保存跑通
  • ClaudeMax实战压测:什么场景下它才不可替代?
  • 质量门脚本:用Python给AI输出加上自动质检(附完整源码)
  • Azure Local离线模式身份规划(系列篇之三)
  • JVM是什么?
  • 良心盘点!2026AI论文写作工具榜单(覆盖 99% 学生论文写作需求)
  • YOLOv13超图视觉与NCNN部署实战指南
  • Wwise音频文件处理终极指南:3分钟掌握游戏音效解包与定制
  • 如何用大模型设计一个“国标级“智能体:从 prompt 到落地的完整指南