Claude Code Auto mode 的成本与延迟,别只看模型价格,还要看每一次动作背后的安全往返
今天讨论 Claude Code 的 Auto mode,最容易被忽略的不是它能不能少弹权限确认框,而是它背后的 classifier 到底怎样改变一次编码会话的成本结构和等待体验。
很多人会自然地以为,Claude Code 里切到更便宜或更快的/model,Auto mode 的安全判断也会跟着变快、变便宜。这个理解并不准确。官方文档写得很清楚,Auto mode 使用的是一个独立的、由服务器配置的 classifier model,它不跟随当前会话里的/model选择变化。也就是说,主会话用 Claude Sonnet、Claude Opus,或者在可用范围内切换别的模型,classifier 的可用性和执行路径并不会因此被改写。真正影响 Auto mode 成本和延迟的,是 classifier 被调用的次数、每次发送的上下文片段大小,以及动作类型是否需要经过这层检查。(Claude)
这件事对工程团队很关键。Claude Code 不是只在生成代码时消耗 token,Auto mode 的 classifier 调用也会计入 token usage。每次检查会把一部分 transcript 和 pending action 发给 classifier,再等一个服务端判断回来,动作才继续执行。这个过程在用户界面里可能只是短暂停顿,但在长任务里会累计成真实的延迟,也会累计成真实的 token 成本。官方文档把这点说得很
