Sonnet 5 发布:Prompt 已死,Loop 当
Sonnet 5 发布:Prompt 已死,Loop 当道
技趣星球 · 用技术创造乐趣。
日期:2026-07-01
6 月 30 日,Anthropic 做了一件很少见的事:同一天发布一个新模型和一套新范式。
Claude Sonnet 5 上线,定位"最擅长 Agent 的 Sonnet 模型",推理和编码能力接近旗舰 Opus 4.8,价格便宜约 60%。同一天,Claude Code 团队发布 “Getting started with loops” 官方文档,把 Loop Engineering 从行业讨论直接做成了产品功能。
这件事的背景是:黄仁勋最近公开说 “Nobody writes prompts anymore”,吴恩达判断 prompt 在 3 到 6 个月内消亡,Anthropic 内部 80% 以上工程师已经在用自改进循环。Sonnet 5 和 Loop 文档同日发布,不是巧合。
Loop 是什么:从踩油门到设计自动驾驶
Google Chrome 工程总监 Addy Osmani 在 6 月 7 日发了一篇文章,把这种变化拆成四层:
| 层级 | 你在做什么 | 你的角色 |
|---|---|---|
| Prompt Engineering | 写好一句话 | 踩油门的人 |
| Context Engineering | 喂好上下文 | 管信息的人 |
| Harness Engineering | 搭好运行环境 | 管工具的人 |
| Loop Engineering | 定义目标、验证标准、停止条件 | 设计自动驾驶 |
Prompt Engineering 时代,你是循环本身——写 prompt,看结果,再写 prompt。Loop Engineering 时代,系统是循环。你只做一次设计,然后它自己转起来。
Boris Cherny 的经历是个极端例子。他用 Claude Code 写了 259 个 PR,最终让 Claude 100% 自我编写。他说:“我不再向 Claude 发送提示词了。我写循环,让循环去提示 Claude。”
四种循环:从手动到全自动
Claude Code 把 Loop 做成了四种产品原语。每种回答同一个问题:谁来触发、谁来判断停、状态放哪。
Turn-Based Loop:你发消息,Claude 做完就停。最基础的模式,适合临时修改和探索。如果你经常重复同一种验证流程,可以把它写进 SKILL.md,Claude 每次自动加载,省掉反复交代背景的麻烦。
Goal-Based Loop:你用/goal设目标和上限。比如/goal get the homepage Lighthouse score to 90 or above, stop after 5 tries。每个回合结束后,一个独立的 evaluator 判断目标有没有达成。关键设计:evaluator 不去翻文件、不跑命令,只看对话里已有的信息。这防止了 Agent 自己篡改证据来"通过"检查。
适合 bug 修复、性能优化这类有明确验证指标的任务。
Time-Based Loop:用/loop 5m设定间隔,Claude 每隔 5 分钟自动跑一轮。适合监控 CI/CD、处理 PR review。关掉终端就停,轻量但不持久。
Proactive Loop:用/schedule托管到云端,外部事件触发,无需人在场。比如/schedule every hour: check #project-feedback for bug reports。适合 issue triage、依赖升级、大规模代码迁移。
Claude Code 官方建议的落地顺序很务实:先写 verification skill,再在任务有明确验证指标时用/goal,最后才考虑/schedule。别一上来就搞全自动。
Sonnet 5 为什么重要:跑循环需要一个便宜但够聪明的模型
Loop 要转起来,模型要反复调用——跑测试、做验证、自我审查。每一轮都烧 token。
Opus 级别跑循环太贵。Haiku 级别不够聪明。Sonnet 5 填的就是这个位置。
优惠期到 8 月 31 日,输入 $2 / MTok、输出 $10 / MTok,比 Opus 4.8 便宜约 60%。能力上,它在单次请求里能自主完成"写复现测试、实现修复、验证 bug 消失"的完整链路。安全方面也做了加固——幻觉和谄媚减少,prompt injection 鲁棒性更强。
如果你打算认真试 Loop,Sonnet 5 是当前性价比最高的选择。Claude Free 和 Pro 计划已默认启用,API 模型名claude-sonnet-5。
四个隐性风险
Addy Osmani 在文章里提醒了一件事:循环跑得越顺,人越容易停止思考。
社区总结的四个风险值得在设计 Loop 时就考虑:
验证债务——代码看起来能跑,但细微错误悄悄合进了主分支。你每一处改动都没仔细看过。
理解腐化——AI 写代码太快,你对整个代码库的理解开始脱节。某天出了线上事故,你甚至不知道去哪排查。
认知投降——审查了几十轮之后,你不再质疑 AI 的输出,全盘接受。循环越自动化,人越容易变成橡皮图章。
Token 失控——Agent 在死循环里反复重试,一晚上烧掉一周的预算。
这些风险不是劝你别用 Loop。它提醒的是:evaluator 必须独立于执行 Agent,停止条件必须设上限。Claude Code 自己就这么做——Goal-Based Loop 的 evaluator 不碰文件系统,每种 Loop 都有最大尝试次数。验证机制不是保险,是前提。
收个尾
- 想快速理解 Loop:直接看 Anthropic 的 “Getting started with loops” 博客,四种循环类型各附了命令示例
- 想试 Sonnet 5:Claude Free 和 Pro 已默认启用,API 模型名
claude-sonnet-5,优惠价到 8 月底 - 正在搭 Agent 工作流:先把验证动作写进 SKILL.md 或等效配置,再考虑自动化触发。验证靠谱了,跑得快才有意义
技趣星球 · 用技术创造乐趣。
