当前位置：首页 > news >正文

内容分享——Scaling Managed Agents: Decoupling the brain from the hands

news 2026/7/24 2:34:30

原文：Scaling Managed Agents: Decoupling the brain from the hands
来源：Anthropic Engineering Blog
作者：Lance Martin, Gabe Cemaj, Michael Cohen

核心命题

Harness（Agent 运行框架）会过时，但接口应该永存。

随着模型能力的快速提升，今天为弥补模型不足而设计的 harness 明天可能就成为"死重"。Anthropic 通过 Managed Agents 解决了一个经典计算机科学问题：如何为"尚未想到的应用程序"设计系统。

一、问题背景：Harness 的"过时"问题

1.1 一个具体案例：Context Anxiety

在 Claude Sonnet 4.5 时代，团队发现模型会在感知到上下文限制接近时过早地结束任务——这种行为被称为"上下文焦虑"。当时的解决方案是在 harness 中加入**上下文重置（context resets）**机制。

然而，当同样的 harness 应用到 Claude Opus 4.5 时，发现这个行为已经消失了。模型变得更聪明了，不再需要这种干预。但上下文重置的代码仍然在那里，成为死重（dead weight）。

1.2 核心洞察

“Harnesses encode assumptions about what Claude can’t do on its own. However, those assumptions need to be frequently questioned because they can go stale as models improve.”
（Harness 编码了关于 Claude 自身无法做什么的假设。但这些假设需要经常被质疑，因为随着模型改进，它们可能会过时。）

这引用了 Rich Sutton 的《The Bitter Lesson》：试图将人类知识编码到系统中的方法，最终会被利用计算能力的通用方法所超越。

二、解决方案：操作系统式的抽象

2.1 类比：操作系统虚拟化硬件

几十年前，操作系统通过将硬件虚拟化为**进程（process）和文件（file）**等抽象来解决同样的问题。这些抽象足够通用，可以支持当时还不存在的应用程序。

关键洞察：

read()命令不关心它访问的是 1970 年代的磁盘组还是现代 SSD
上层的抽象保持稳定，而底层实现可以自由变化

2.2 Managed Agents 的三层虚拟化

Managed Agents 遵循同样的模式，将 Agent 组件虚拟化为三个核心抽象：

组件	类比	功能
Session	文件系统	只追加日志，记录发生的一切
Harness	进程调度器	调用 Claude 并将工具调用路由到相应基础设施的循环
Sandbox	执行单元	Claude 可以运行代码和编辑文件的执行环境

这种设计允许每个组件的实现被替换，而不会干扰其他组件。

三、架构演进：从"宠物"到"牲畜"

3.1 第一代架构：紧耦合的"宠物"

初始设计：所有 Agent 组件放在单个容器中

Session、Agent Harness、Sandbox 共享一个环境
好处：文件编辑是直接系统调用，无需设计服务边界

问题：采用了"宠物（pet）"模式

在宠物 vs 牲畜（pets-vs-cattle）的类比中：
宠物：有名字的、手工维护的个体，你无法承受失去它
牲畜：可互换的、批量管理的实例

在这个类比中，服务器变成了宠物——如果容器失败，session 就丢失了；如果容器无响应，必须手工 nursed 恢复健康。

3.2 调试噩梦

紧耦合带来的具体问题：

故障定位困难
- 唯一的观察窗口是 WebSocket 事件流
- 无法区分是 harness bug、事件流丢包，还是容器离线
- 工程师必须进入容器内部调试
- 但容器通常包含用户数据，实际上缺乏调试能力
网络假设固化
- Harness 假设 Claude 操作的所有资源都在同一个容器内
- 当客户要求连接到他们的 VPC 时，必须：
  - 将他们的网络与 Anthropic 的网络对等连接，或者
  - 在客户自己的环境中运行 harness
- 一个 baked into harness 的假设成为了连接不同基础设施的障碍

四、解耦架构："大脑"与"手"分离

4.1 核心设计原则

将"大脑"（Brain）与"手"（Hands）以及"会话"（Session）解耦。

每个组件成为对接口做很少假设的独立单元，可以独立失败或被替换。

4.2 Harness 离开容器

变化：Harness 不再生活在容器内部。

新的调用方式：

execute(name, input) → string

Harness 像调用任何其他工具一样调用容器。

结果：

容器变成了牲畜（cattle）
如果容器死亡，harness 将其作为工具调用错误捕获并返回给 Claude
如果 Claude 决定重试，可以用标准配方provision({resources})重新初始化新容器
不再需要 nursed 失败的容器恢复健康

4.3 Harness 故障恢复

关键设计：Session log 位于 harness 外部。

这意味着：

Harness 内部没有任何需要在崩溃后存活的东西
当 harness 失败时，可以用wake(sessionId)重启新的 harness
使用getSession(id)恢复事件日志
从最后一个事件恢复执行

持久化机制：

emitEvent(id, event) // 在 agent 循环中写入 session，保持事件的持久记录

4.4 安全边界

紧耦合设计的安全问题：

Claude 生成的任何不受信任的代码在与凭证相同的容器中运行
提示注入只需要说服 Claude 读取自己的环境
一旦攻击者获得令牌，可以生成新的无限制 session

解耦后的安全改进：

Git 认证模式
- 使用每个仓库的访问令牌在 sandbox 初始化期间克隆仓库
- 将令牌接入本地 git remote
- Git push/pull 在 sandbox 内工作，但 agent从不直接处理令牌
MCP 工具认证模式
- OAuth 令牌存储在安全 vault 中
- Claude 通过专用代理调用 MCP 工具
- 代理接收与 session 关联的令牌
- 代理从 vault 获取凭证并调用外部服务
- Harness 永远不会知道任何凭证

五、Session：超越 Claude 的上下文窗口

5.1 长程任务的上下文挑战

长程任务通常超过 Claude 的上下文窗口长度。标准解决方案都涉及不可逆的决策：

技术	描述	问题
Compaction	Claude 保存上下文窗口的摘要	原始信息丢失
Memory Tool	Claude 将上下文写入文件	需要显式管理
Context Trimming	选择性移除旧工具结果或思考块	可能删除未来需要的信息

核心问题：很难知道未来的 turn 需要哪些 token。

5.2 Session 作为上下文对象

Managed Agents 中，session 作为位于 Claude 上下文窗口之外的上下文对象。

接口设计：

getEvents() // 允许大脑通过选择事件流的位置切片来查询上下文

使用方式：

从上次停止读取的位置继续
回退到特定时刻前的几个事件查看前因
在特定动作前重新读取上下文

5.3 关注点分离

Session：负责可恢复的上下文存储（持久化、可靠）
Harness：负责任意的上下文管理（组织、缓存优化、上下文工程）

这种分离的原因是：无法预测未来模型需要什么样的特定上下文工程。

六、性能优化：多大脑、多手

6.1 解耦前的性能瓶颈

问题：每个大脑需要同样多的容器

每个 session 必须预先支付完整的容器设置成本
即使永远不会 touch sandbox 的 session，也必须克隆仓库、启动进程、获取待处理事件

指标：Time-to-first-token (TTFT)

衡量 session 从接受工作到产生第一个响应 token 的等待时间
这是用户最能感受到的延迟

6.2 解耦后的性能提升

变化：容器仅在需要时由大脑通过工具调用execute(name, input) → string配置。

结果：

不需要立即使用容器的 session 不需要等待容器
推理可以在编排层从 session log 拉取待处理事件后立即开始

性能数据：

p50 TTFT 下降约 60%
p95 TTFT 下降超过 90%

扩展到多个大脑只需启动多个无状态 harness，仅在需要时连接手。

6.3 多手的认知挑战

目标：让每个大脑能够连接到多个手（执行环境）。

挑战：Claude 必须推理多个执行环境并决定向哪里发送工作——这比在单个 shell 中操作是更难的认知任务。

解耦后的能力：

每个手成为一个工具：execute(name, input) → string
输入名称和输入，返回字符串
支持任何自定义工具、任何 MCP 服务器、Anthropic 自己的工具
Harness 不知道 sandbox 是容器、手机还是 Pokémon 模拟器
因为没有任何手与任何大脑耦合，大脑可以相互传递手

七、Meta-Harness 设计哲学

7.1 核心思想

Managed Agents 是一个meta-harness（元框架）：

“Unopinionated about the specific harness that Claude will need in the future. Rather, it is a system with general interfaces that allow many different harnesses.”
（不对 Claude 未来需要的特定 harness 持意见。相反，它是一个具有通用接口的系统，允许多种不同的 harness。）