Claude Code Harness Engineering介绍(Agent = Model + Harness 模型提供智力,Harness(马具/控制系统) 提供控制、可靠性和生产力)多代理协作
Code Harness:AI Agent 的超级引擎——Claude Code 背后的秘密
引言:为什么“Harness”才是真正的决胜点?
2025-2026 年,AI 编码工具爆发式增长:Claude Code、Cursor、Aider、Cline 等层出不穷。很多人以为胜负取决于底层模型(谁的 LLM 更聪明),但真正的高手和 Anthropic 内部却达成了共识:
Agent = Model + Harness
模型提供智力,Harness(马具/控制系统)提供控制、可靠性和生产力。
Code Harness(代码马具 / Agent Harness)就是围绕大模型构建的完整工程基础设施。它把一个“会聊天的 LLM”变成能长期自主编码、读写文件、运行测试、跨会话保持一致性的真正 Agent。
Claude Code 的成功,不是因为 Claude 模型突然变得无比强大,而是因为 Boris Cherny 及其团队打造了一套顶级的Code Harness。
Code Harness 到底是什么?
Harness是模型与真实世界之间的“中间层”:
- 不是单纯的 Prompt Engineering
- 不是简单的 Tool Calling
- 而是一整套生产级系统,包括:工具调度、权限控制、上下文管理、状态持久化、错误恢复、多 Agent 协作、监控循环等。
简单说,它是让 Agent “靠谱地活下去”的操作系统。
Anthropic 官方工程博客多次强调:Harness design 是 agentic coding 前沿性能的关键。
Claude Code Harness 的核心架构
根据公开的 Anthropic 工程文章、源码泄露分析(2026 年事件)和 Boris Cherny 的分享,Claude Code Harness 主要包含以下部分:
Master Loop(主循环)
单线程或协调式循环,不断驱动:感知(读上下文)→ 推理 → Tool Call → 执行结果反馈 → 下一轮。直到任务完成或需要人工介入。Tool System(工具层,约 40 个权限门控工具)
- 文件读写、bash 执行、grep、glob、浏览器、LSP(语言服务器)集成等。
- 严格权限控制:默认谨慎模式,每项危险操作需用户批准;内置分类器自动判断安全动作。
- Typed schemas 约束模型输出,确保 harness 能可靠解析和执行。
Context & Memory Management(上下文与记忆)
- 多层记忆架构:对抗“context entropy”(上下文混乱)。
- 支持长运行(long-running)跨多个 context window。
- Initializer Agent:首次会话负责项目初始化、任务分解、环境搭建、留下清晰 artifacts。
- Coding Sub-Agents:后续会话专注增量实现,自动 compaction(上下文压缩)。
- CLAUDE.md、Skills(.claude/skills/ 目录下的 Markdown 技能包)提供持久项目规则。
Multi-Agent Orchestration(多代理协作)
Planner / Generator / Evaluator 三代理结构(受 GAN 启发),或 Initiator + Sub-agents 模式。支持并行舰队(fleet of Claudes)。Safety & Recovery
沙箱执行、失败重试、会话日志完整记录(每条消息、tool call 都可追溯)。人类始终保留最终决策权。Claude Agent SDK
Anthropic 提供的通用 harness 基础,Claude Code 在此之上高度定制。
诞生故事:Boris Cherny 的“意外”
Boris Cherny(前 Meta Principal Engineer,《Programming TypeScript》作者)2024 年加入 Anthropic 后,用 Claude 做各种原型。最初只是个简单命令行工具(甚至能识别你在听什么歌),后来逐步获得文件系统权限,在公司内部爆火,最终演变为正式产品。
他强调:早期 Claude Code 并不惊艳,直到模型(Sonnet/Opus 4 系列)足够强大 + harness 迭代成熟,才实现爆发。现在 Anthropic 大部分代码都由 Claude Code 编写,工程师生产力大幅提升。
为什么 Harness 这么重要?实际影响
- 相同模型,不同 Harness,性能天差地别。Terminal Bench 等评测显示,换个好 harness 能让同一模型排名大幅上升。
- 解决 Long-Running Agent 难题:跨会话、跨 context window 保持一致性。
- 可复制性:2026 年源码泄露后,社区涌现大量“从零构建 Claude Code 式 harness”的教程和开源项目。
- 未来方向:Harness Engineering 已成为新学科。Prompt → Context → Harness 是进化路径。
如何开始构建或使用自己的 Code Harness?
- 直接用 Claude Code(最推荐)。
- 参考 Anthropic 官方:
- Effective harnesses for long-running agents
- Harness design for long-running application development
- 开源/社区:研究 Claude Agent SDK quickstarts、GitHub trending 的 best practices repos。
- 核心原则(Boris 分享):
- 信任模型,但用严格工具和权限约束它。
- 做好初始化和 artifacts 交接。
- 人类负责方向,Agent 负责执行。
- 迭代 harness,比单纯优化 prompt 更重要。
结语:Harness 时代已经到来
Code Harness 代表了 AI Agent 从“玩具”走向“生产力工具”的关键工程跃迁。模型会越来越强,但决定你能走多远的,永远是那套把模型“套”好的马具。
未来,顶级工程师不再只是写代码,而是设计、优化和编排 harness——让 AI 像优秀团队一样可靠地工作。
你准备好拥抱 Harness Engineering 了吗?
参考来源:Anthropic 官方工程博客、Boris Cherny 访谈与分享、2026 年社区对 Claude Code 架构的分析。
