当前位置: 首页 > news >正文

Anthropic 的 Agent 架构

Anthropic 在全力押注 Agent!

其工程博客是其技术团队对外输出工程实践和方法论的主要渠道。

从 2024 年 9 月到 2026 年 3 月, Agent 架构占了发表的所有文章的近四成,是最大头。

从最早的怎么设计 Agent,到后来怎么给它好工具、怎么让它跑长任务不翻车,一直到今年初 16 个 Claude 并行写出一个 C 编译器。

路线

如何设计Agent —— 如何给Agent好工具 —— 如何让Agent长时间自主工作 —— Agent能做多大的事

归纳起来,其底层约束是上下文工程。

怎么在有限的 token 里塞进最多有用的信息,从 RAG 优化一路演进到了系统性的方法论。

逐篇摘要

1. Building Effective Agents (2024-12-19)

基于与数十个团队合作经验的 Agent 设计原则总结。

区分 workflow(预定义路径)与 Agent(动态自主决策)。

提出六种架构模式:增强型 LLM、提示链、路由、并行化、编排者-工作者、评估者-优化者。

核心主张:最成功的实现采用简单可组合模式而非复杂框架。

2. Claude Code: Best Practices for Agentic Coding (2025-04-18)

系统性使用指南。

核心约束:上下文窗口是最重要的有限资源。

关键实践:让 Claude 自我验证(提供测试用例是效果提升最大的策略)、先探索再规划再编码、配置好 CLAUDE.md、积极管理会话(/clear 重置、/rewind 回退)。

3. How We Built Our Multi-Agent Research System (2025-06-13)

Claude Research 工程实践。

协调者-执行者架构,主智能体并行派发子智能体搜索。

多智能体比单一 Opus 4 提升 90.2%,但 token 消耗高达 15 倍。

总结八条提示词策略和以结果为导向的评估方法。

4. Writing Effective Tools for Agents (2025-09-11)

Agent 能力上限取决于工具质量。

五大设计原则:选择正确的工具、命名空间化、返回有意义的上下文、优化 Token 效率(分页/过滤/截断)、提示工程化工具描述。

强调评测驱动的迭代方法。

5. Code Execution with MCP (2025-11-04)

将 MCP 服务器封装为代码 API 而非直接工具调用。

Agent 通过文件系统按需加载工具定义,Token 消耗从 15 万降至 2000(减少 98.7%)。

核心优势:渐进式发现、数据过滤、控制流效率、状态持久化。

6. Effective Harnesses for Long-Running Agents (2025-11-26)

解决长时运行 Agent 跨会话连贯性问题。

两大失败模式:一次性塞满上下文导致不完整,或后续会话误判为已完成。

方案采用两阶段架构:初始化 Agent 创建环境和 JSON 功能列表,后续 Agent 按固定流程逐功能推进并通过 git 提交实现状态持久化。

7. Building a C Compiler with Parallel Claudes (2026-02-05)

16 个并行 Claude Opus 4.6 实例通过 Git 同步协作,两周内构建基于 Rust 的 C 编译器。

产出 10 万行代码,能编译 Linux 6.9 内核,GCC torture 通过率 99%。

消耗 20 亿输入 token,成本约 2 万美元。

http://www.jsqmd.com/news/722638/

相关文章:

  • Flowable 流程审计与排查:如何通过历史任务查询快速定位线上问题
  • **边缘AI新范式:基于Python的轻量级模型部署实战与优化策略**在人工智能飞速发展的今天,
  • SketchUp渲染插件怎么选?从V-Ray到Enscape,7款主流工具深度横评与新手避坑指南
  • 线扫描相机在色滤光片检测中的应用与技术解析
  • AI 任务执行链路的静默中断:从状态机缺陷到分层重试的工程治理
  • 从数据展示到场景叙事:用ECharts 3D地图贴图打造沉浸式业务大屏
  • 安装CentOS
  • 错误不再失控,PHP 8.9新增ErrorFilter与TypedErrorHandler,如何重构你的异常治理层?
  • PyTorch深度学习实战 |SegNet
  • 2026年,如何选择真正靠谱的美发店收银软件?
  • Python的__set_name__描述符协议:在所属类中注册描述符
  • 告别MySQL思维:在DBeaver里玩转PostgreSQL的序列、函数与触发器(实战避坑)
  • 别再硬啃CAA文档了!手把手教你用CATIA DMU模块实现运动仿真(附完整C++代码)
  • Git 命令大全:覆盖日常开发场景的实战指南
  • 硬件工程师避坑指南:DDR3布线选T型还是Fly-by?实测信号眼图对比与Write Leveling配置要点
  • InferLLM:轻量级大模型推理引擎,打通端侧AI部署最后一公里
  • 基于Tauri与React构建跨平台桌面工具箱:Clawset的设计与实现
  • 线上知识竞赛策划指南:如何让活动更有趣吸引人
  • 2026成都仓储物流用方管供应优质商家推荐:方管批发厂推荐,方管销售厂,钢材厂家,钢材市场,优选推荐! - 优质品牌商家
  • 基于 STM32 + ESP8266 + W25Q64 的双核 OTA 底层架构总结
  • CentOS 7生产环境离线升级GCC全记录:从4.8.5到12.2.0的踩坑与避坑指南
  • 从运维视角看致远OA:如何快速自查并修复这三个高危文件上传漏洞(附修复脚本)
  • 3分钟掌握7-Zip:开源压缩工具实战指南与性能优化
  • 2026年小程序商城哪个平台最好?
  • 《中文AI圈炸了!860个智能体涌入「机乎」,人类竟被“请出”群聊?》
  • Synaptics SYN4382三模无线SoC技术解析与应用
  • 免费QQ空间备份神器:GetQzonehistory完整指南,永久保存青春记忆
  • Vue3移动端项目实战:用vue-virtual-scroller优雅集成Vant的PullRefresh和List组件
  • 拒绝“人海战术”:如何用 AI 翻译+自动化链路,重塑 LinkedIn 跨境开发流?
  • Qwen3模型网络故障诊断辅助:图解常见错误与解决方案