Anthropic 的 Agent 架构
Anthropic 在全力押注 Agent!
其工程博客是其技术团队对外输出工程实践和方法论的主要渠道。
从 2024 年 9 月到 2026 年 3 月, Agent 架构占了发表的所有文章的近四成,是最大头。
从最早的怎么设计 Agent,到后来怎么给它好工具、怎么让它跑长任务不翻车,一直到今年初 16 个 Claude 并行写出一个 C 编译器。
路线
如何设计Agent —— 如何给Agent好工具 —— 如何让Agent长时间自主工作 —— Agent能做多大的事
归纳起来,其底层约束是上下文工程。
怎么在有限的 token 里塞进最多有用的信息,从 RAG 优化一路演进到了系统性的方法论。
逐篇摘要
1. Building Effective Agents (2024-12-19)
基于与数十个团队合作经验的 Agent 设计原则总结。
区分 workflow(预定义路径)与 Agent(动态自主决策)。
提出六种架构模式:增强型 LLM、提示链、路由、并行化、编排者-工作者、评估者-优化者。
核心主张:最成功的实现采用简单可组合模式而非复杂框架。
2. Claude Code: Best Practices for Agentic Coding (2025-04-18)
系统性使用指南。
核心约束:上下文窗口是最重要的有限资源。
关键实践:让 Claude 自我验证(提供测试用例是效果提升最大的策略)、先探索再规划再编码、配置好 CLAUDE.md、积极管理会话(/clear 重置、/rewind 回退)。
3. How We Built Our Multi-Agent Research System (2025-06-13)
Claude Research 工程实践。
协调者-执行者架构,主智能体并行派发子智能体搜索。
多智能体比单一 Opus 4 提升 90.2%,但 token 消耗高达 15 倍。
总结八条提示词策略和以结果为导向的评估方法。
4. Writing Effective Tools for Agents (2025-09-11)
Agent 能力上限取决于工具质量。
五大设计原则:选择正确的工具、命名空间化、返回有意义的上下文、优化 Token 效率(分页/过滤/截断)、提示工程化工具描述。
强调评测驱动的迭代方法。
5. Code Execution with MCP (2025-11-04)
将 MCP 服务器封装为代码 API 而非直接工具调用。
Agent 通过文件系统按需加载工具定义,Token 消耗从 15 万降至 2000(减少 98.7%)。
核心优势:渐进式发现、数据过滤、控制流效率、状态持久化。
6. Effective Harnesses for Long-Running Agents (2025-11-26)
解决长时运行 Agent 跨会话连贯性问题。
两大失败模式:一次性塞满上下文导致不完整,或后续会话误判为已完成。
方案采用两阶段架构:初始化 Agent 创建环境和 JSON 功能列表,后续 Agent 按固定流程逐功能推进并通过 git 提交实现状态持久化。
7. Building a C Compiler with Parallel Claudes (2026-02-05)
16 个并行 Claude Opus 4.6 实例通过 Git 同步协作,两周内构建基于 Rust 的 C 编译器。
产出 10 万行代码,能编译 Linux 6.9 内核,GCC torture 通过率 99%。
消耗 20 亿输入 token,成本约 2 万美元。
