当前位置: 首页 > news >正文

Sonnet 5 发布:Prompt 已死,Loop 当

Sonnet 5 发布:Prompt 已死,Loop 当道

技趣星球 · 用技术创造乐趣。
日期:2026-07-01

6 月 30 日,Anthropic 做了一件很少见的事:同一天发布一个新模型和一套新范式。

Claude Sonnet 5 上线,定位"最擅长 Agent 的 Sonnet 模型",推理和编码能力接近旗舰 Opus 4.8,价格便宜约 60%。同一天,Claude Code 团队发布 “Getting started with loops” 官方文档,把 Loop Engineering 从行业讨论直接做成了产品功能。

这件事的背景是:黄仁勋最近公开说 “Nobody writes prompts anymore”,吴恩达判断 prompt 在 3 到 6 个月内消亡,Anthropic 内部 80% 以上工程师已经在用自改进循环。Sonnet 5 和 Loop 文档同日发布,不是巧合。

Loop 是什么:从踩油门到设计自动驾驶

Google Chrome 工程总监 Addy Osmani 在 6 月 7 日发了一篇文章,把这种变化拆成四层:

层级你在做什么你的角色
Prompt Engineering写好一句话踩油门的人
Context Engineering喂好上下文管信息的人
Harness Engineering搭好运行环境管工具的人
Loop Engineering定义目标、验证标准、停止条件设计自动驾驶

Prompt Engineering 时代,你是循环本身——写 prompt,看结果,再写 prompt。Loop Engineering 时代,系统是循环。你只做一次设计,然后它自己转起来。

Boris Cherny 的经历是个极端例子。他用 Claude Code 写了 259 个 PR,最终让 Claude 100% 自我编写。他说:“我不再向 Claude 发送提示词了。我写循环,让循环去提示 Claude。”

四种循环:从手动到全自动

Claude Code 把 Loop 做成了四种产品原语。每种回答同一个问题:谁来触发、谁来判断停、状态放哪。

Turn-Based Loop:你发消息,Claude 做完就停。最基础的模式,适合临时修改和探索。如果你经常重复同一种验证流程,可以把它写进 SKILL.md,Claude 每次自动加载,省掉反复交代背景的麻烦。

Goal-Based Loop:你用/goal设目标和上限。比如/goal get the homepage Lighthouse score to 90 or above, stop after 5 tries。每个回合结束后,一个独立的 evaluator 判断目标有没有达成。关键设计:evaluator 不去翻文件、不跑命令,只看对话里已有的信息。这防止了 Agent 自己篡改证据来"通过"检查。

适合 bug 修复、性能优化这类有明确验证指标的任务。

Time-Based Loop:用/loop 5m设定间隔,Claude 每隔 5 分钟自动跑一轮。适合监控 CI/CD、处理 PR review。关掉终端就停,轻量但不持久。

Proactive Loop:用/schedule托管到云端,外部事件触发,无需人在场。比如/schedule every hour: check #project-feedback for bug reports。适合 issue triage、依赖升级、大规模代码迁移。

Claude Code 官方建议的落地顺序很务实:先写 verification skill,再在任务有明确验证指标时用/goal,最后才考虑/schedule。别一上来就搞全自动。

Sonnet 5 为什么重要:跑循环需要一个便宜但够聪明的模型

Loop 要转起来,模型要反复调用——跑测试、做验证、自我审查。每一轮都烧 token。

Opus 级别跑循环太贵。Haiku 级别不够聪明。Sonnet 5 填的就是这个位置。

优惠期到 8 月 31 日,输入 $2 / MTok、输出 $10 / MTok,比 Opus 4.8 便宜约 60%。能力上,它在单次请求里能自主完成"写复现测试、实现修复、验证 bug 消失"的完整链路。安全方面也做了加固——幻觉和谄媚减少,prompt injection 鲁棒性更强。

如果你打算认真试 Loop,Sonnet 5 是当前性价比最高的选择。Claude Free 和 Pro 计划已默认启用,API 模型名claude-sonnet-5

四个隐性风险

Addy Osmani 在文章里提醒了一件事:循环跑得越顺,人越容易停止思考。

社区总结的四个风险值得在设计 Loop 时就考虑:

验证债务——代码看起来能跑,但细微错误悄悄合进了主分支。你每一处改动都没仔细看过。

理解腐化——AI 写代码太快,你对整个代码库的理解开始脱节。某天出了线上事故,你甚至不知道去哪排查。

认知投降——审查了几十轮之后,你不再质疑 AI 的输出,全盘接受。循环越自动化,人越容易变成橡皮图章。

Token 失控——Agent 在死循环里反复重试,一晚上烧掉一周的预算。

这些风险不是劝你别用 Loop。它提醒的是:evaluator 必须独立于执行 Agent,停止条件必须设上限。Claude Code 自己就这么做——Goal-Based Loop 的 evaluator 不碰文件系统,每种 Loop 都有最大尝试次数。验证机制不是保险,是前提。

收个尾

  • 想快速理解 Loop:直接看 Anthropic 的 “Getting started with loops” 博客,四种循环类型各附了命令示例
  • 想试 Sonnet 5:Claude Free 和 Pro 已默认启用,API 模型名claude-sonnet-5,优惠价到 8 月底
  • 正在搭 Agent 工作流:先把验证动作写进 SKILL.md 或等效配置,再考虑自动化触发。验证靠谱了,跑得快才有意义

技趣星球 · 用技术创造乐趣。

http://www.jsqmd.com/news/1105946/

相关文章:

  • Java实现Navicat密码加密解密:AES-256-CBC本地安全存储实战
  • 短效代理适合哪些业务场景?资深玩家实测科普适配场景指南
  • 使用74HC165与ARM Cortex-M4实现高效并行转串行输入设计
  • QuickVina 2深度解析:20倍加速的分子对接性能揭秘
  • IS31FL3731 LED驱动芯片与PIC18F24K50微控制器的嵌入式开发实践
  • 【精通】SmartWriter v2.5:写作平台 CI/CD — 提示词版本管理、A/B 评测与回归验证深度实战
  • Go 进阶必修:90% 的人都没用对的“表驱动法”
  • 关于动态规划【力扣300.最长递增子序列的思考】
  • 给制造以光,让智造有根:中策橡胶卓越智能工厂背后的F5G-A全光力量
  • 华为MetaERP Oracle EBS R12 AP 供应商主数据完整配置指南(架构师实施版)一、前置基础配置(必须先完成,否则供应商无法正常使用)(一)财务选项 Financials Opti
  • 基于树莓派的边缘计算安全网关设计与实现
  • 2026燃油车底盘整备调校,选对修理厂事半功倍
  • 【云原生与DevOps】07-Istio服务网格落地:从试点到全量的踩坑记录
  • AI时代大学生找实习,企业真正筛选的不是技术栈而是思维方式
  • Claude Fable 5 system prompt 解读与效果评估
  • 平基土石方三维计算软件V0.4.1版更新
  • 保姆级教程:OpenCode 14 个社区插件 + 6 个实战案例,建议收藏,手把手带你打造最强 AI 编码环境
  • 告别排版焦虑:Markdown一键转公众号格式,这几款工具让创作回归纯粹
  • 【第 9 篇:本地化部署——从 0 到 1 的企业级系统部署全记录】
  • Walmart SDE Interview Experience 三轮 VO 高频面经 | System Design + BQ + 算法 稳稳拿 Offer(2026)
  • 标题:Linux企业实战:打造高性能网关并实现基于IP的精准流量整形
  • 5分钟学会免费音乐解锁:打破平台限制的完整指南
  • 导师严选!盘点2026年备受推崇的的AI智能降重工具
  • P5574 [CmdOI2019] 任务分配问题
  • 【AgentScope Java新手村系列】(16)从RAG到多路检索
  • Linux基础文件与目录命令实操实验报告
  • 什么情况我们用到异步编程
  • 技术深度解析:TranslucentTB系统集成工具部署失败与权限冲突解决方案
  • 电子自旋的诡异之谜破解 —— 原创电子结构理
  • 2026年ISO认证代办公司选型全指南:解码中小企业的合规破局之路