当前位置：首页 > news >正文

Claude Code 的缓存究竟住在哪里

news 2026/7/2 19:22:21

我们在使用 Claude Code 做长会话开发时，经常会看到一个现象，同一个项目里连续追问时，前几轮可能比较慢，等系统提示、项目规则、工具定义、历史消息这些内容稳定下来，后面的响应会明显顺滑。很多人会自然地去本地目录里找缓存，怀疑它是不是藏在~/.claude下面，或者是不是某个会话文件被 Claude Code 反复读取。这个直觉只对了一小半。Claude Code 的本地目录确实会保存会话记录、项目状态和一些运行数据，但这里讨论的 prompt caching 并不住在本地机器上。它发生在服务端，准确地说，发生在最终承载模型推理请求的那套基础设施里。

这件事要从 Claude Code 的请求路径说起。Claude Code 每次和模型交互，都不是把某个神秘的本地状态直接交给模型，而是把当前回合所需的上下文重新组织成一次网络请求。这个请求里会包含系统提示、项目上下文、工具定义、历史消息、工具结果以及本轮输入。prompt caching 的价值正在这里，它让服务端识别这些请求开头部分里那些连续重复的内容，并把已经处理过的 prefix 复用起来。Anthropic 的文档把 prompt caching 描述为一种从 prompt 的特定 prefix 恢复处理的机制，用来减少重复任务和稳定 prompt 元素带来的处理时间与成本。

缓存放在哪里，不由 Claude Code 这个 CLI 单独决定，而由认证方式和请求最终流向决定。使用 Claude API key、Claude 订阅账号，或者 Claude Platform on AWS 时，请求进入的是 Anthropic 相关基础设施，缓存也随之放在 Anthropic 侧的服务端缓存体系里。这里的关键词不是本地，而是 serving infr

查看全文

http://www.jsqmd.com/news/1110701/