当前位置: 首页 > news >正文

Claude Code Harness Engineering介绍(Agent = Model + Harness 模型提供智力,Harness(马具/控制系统) 提供控制、可靠性和生产力)多代理协作

Code Harness:AI Agent 的超级引擎——Claude Code 背后的秘密

引言:为什么“Harness”才是真正的决胜点?

2025-2026 年,AI 编码工具爆发式增长:Claude Code、Cursor、Aider、Cline 等层出不穷。很多人以为胜负取决于底层模型(谁的 LLM 更聪明),但真正的高手和 Anthropic 内部却达成了共识:

Agent = Model + Harness
模型提供智力,Harness(马具/控制系统)提供控制、可靠性和生产力。

Code Harness(代码马具 / Agent Harness)就是围绕大模型构建的完整工程基础设施。它把一个“会聊天的 LLM”变成能长期自主编码、读写文件、运行测试、跨会话保持一致性的真正 Agent。

Claude Code 的成功,不是因为 Claude 模型突然变得无比强大,而是因为 Boris Cherny 及其团队打造了一套顶级的Code Harness

Code Harness 到底是什么?

Harness是模型与真实世界之间的“中间层”:

  • 不是单纯的 Prompt Engineering
  • 不是简单的 Tool Calling
  • 而是一整套生产级系统,包括:工具调度、权限控制、上下文管理、状态持久化、错误恢复、多 Agent 协作、监控循环等。

简单说,它是让 Agent “靠谱地活下去”的操作系统。

Anthropic 官方工程博客多次强调:Harness design 是 agentic coding 前沿性能的关键

Claude Code Harness 的核心架构

根据公开的 Anthropic 工程文章、源码泄露分析(2026 年事件)和 Boris Cherny 的分享,Claude Code Harness 主要包含以下部分:

  1. Master Loop(主循环)
    单线程或协调式循环,不断驱动:感知(读上下文)→ 推理 → Tool Call → 执行结果反馈 → 下一轮。直到任务完成或需要人工介入。

  2. Tool System(工具层,约 40 个权限门控工具)

    • 文件读写、bash 执行、grep、glob、浏览器、LSP(语言服务器)集成等。
    • 严格权限控制:默认谨慎模式,每项危险操作需用户批准;内置分类器自动判断安全动作。
    • Typed schemas 约束模型输出,确保 harness 能可靠解析和执行。
  3. Context & Memory Management(上下文与记忆)

    • 多层记忆架构:对抗“context entropy”(上下文混乱)。
    • 支持长运行(long-running)跨多个 context window。
    • Initializer Agent:首次会话负责项目初始化、任务分解、环境搭建、留下清晰 artifacts。
    • Coding Sub-Agents:后续会话专注增量实现,自动 compaction(上下文压缩)。
    • CLAUDE.md、Skills(.claude/skills/ 目录下的 Markdown 技能包)提供持久项目规则。
  4. Multi-Agent Orchestration(多代理协作)
    Planner / Generator / Evaluator 三代理结构(受 GAN 启发),或 Initiator + Sub-agents 模式。支持并行舰队(fleet of Claudes)。

  5. Safety & Recovery
    沙箱执行、失败重试、会话日志完整记录(每条消息、tool call 都可追溯)。人类始终保留最终决策权。

  6. Claude Agent SDK
    Anthropic 提供的通用 harness 基础,Claude Code 在此之上高度定制。

诞生故事:Boris Cherny 的“意外”

Boris Cherny(前 Meta Principal Engineer,《Programming TypeScript》作者)2024 年加入 Anthropic 后,用 Claude 做各种原型。最初只是个简单命令行工具(甚至能识别你在听什么歌),后来逐步获得文件系统权限,在公司内部爆火,最终演变为正式产品。

他强调:早期 Claude Code 并不惊艳,直到模型(Sonnet/Opus 4 系列)足够强大 + harness 迭代成熟,才实现爆发。现在 Anthropic 大部分代码都由 Claude Code 编写,工程师生产力大幅提升。

为什么 Harness 这么重要?实际影响

  • 相同模型,不同 Harness,性能天差地别。Terminal Bench 等评测显示,换个好 harness 能让同一模型排名大幅上升。
  • 解决 Long-Running Agent 难题:跨会话、跨 context window 保持一致性。
  • 可复制性:2026 年源码泄露后,社区涌现大量“从零构建 Claude Code 式 harness”的教程和开源项目。
  • 未来方向:Harness Engineering 已成为新学科。Prompt → Context → Harness 是进化路径。

如何开始构建或使用自己的 Code Harness?

  1. 直接用 Claude Code(最推荐)。
  2. 参考 Anthropic 官方
    • Effective harnesses for long-running agents
    • Harness design for long-running application development
  3. 开源/社区:研究 Claude Agent SDK quickstarts、GitHub trending 的 best practices repos。
  4. 核心原则(Boris 分享):
    • 信任模型,但用严格工具和权限约束它。
    • 做好初始化和 artifacts 交接。
    • 人类负责方向,Agent 负责执行。
    • 迭代 harness,比单纯优化 prompt 更重要。

结语:Harness 时代已经到来

Code Harness 代表了 AI Agent 从“玩具”走向“生产力工具”的关键工程跃迁。模型会越来越强,但决定你能走多远的,永远是那套把模型“套”好的马具

未来,顶级工程师不再只是写代码,而是设计、优化和编排 harness——让 AI 像优秀团队一样可靠地工作。

你准备好拥抱 Harness Engineering 了吗?


参考来源:Anthropic 官方工程博客、Boris Cherny 访谈与分享、2026 年社区对 Claude Code 架构的分析。

http://www.jsqmd.com/news/766144/

相关文章:

  • 实测!国内正规超声波细胞破碎仪生产商推荐给科研工作者 - 速递信息
  • 虚拟机网络模式笔记
  • GD32F427VKT6驱动GD25Q64 Flash实战:从SPI初始化到读写数据的完整流程
  • 惠阳家电类模胚专业加工资源推荐 - 昌晖模胚
  • FramePack终极指南:3个关键技巧让AI视频创作像画画一样简单
  • 高效解锁音乐自由:qmc-decoder全面指南
  • taotoken用量看板如何帮助开发者清晰掌握月度api开支
  • 28_《智能体微服务架构企业级实战教程》Redis FastMCP服务之操作工具封装
  • 上海用户如何找到知名的二氧化碳培养箱制造商?2026年实测方案 - 速递信息
  • 2026年实测!上海用户如何挑选知名超声波细胞破碎仪品牌? - 速递信息
  • Unity JSON处理终极指南:Newtonsoft.Json-for-Unity完整实战教程
  • Segment Anything Model (SAM) 实战指南:从零构建交互式图像分割应用
  • MySQL如何防止内部员工越权查看数据_实施严格的日志审计策略
  • 2026年:MCP协议如何重塑AI Agent的生态格局
  • 上海企业如何找到知名的超声波细胞破碎仪品牌?2026年实测方案 - 速递信息
  • 智能体记忆管理:DayDreaming技能实现重启导向的连续性检查点
  • 信号与系统作业救星:用Python+Heaviside函数搞定7种典型信号波形(附完整代码)
  • 20254203 2025-2026-2 《Python程序设计》实验3报告
  • 上海生物企业实测2026超声波细胞破碎仪选厂避坑指南 - 速递信息
  • Beacon协议:构建AI智能体社交与经济系统的去中心化通信框架
  • 别再只会用OpenCV了!用Qt的QImage实现图片加载、缩放、滤镜(附完整代码)
  • SITS2026深度拆解:AISMM评估7步法——从合规对标到能力跃迁的实战路径
  • KSail:统一Kubernetes本地开发工具链的聚合器与标准化平台
  • 上海生物实验室实测:五家超声波细胞破碎仪制造厂对比推荐 - 速递信息
  • 滴滴校招怎么准备:别只背 Redis 和锁,它更像实时系统和调度语境
  • 2026年实验室如何选对超声波细胞破碎仪?五大品牌实测避开选购误区 - 速递信息
  • 跨平台GUI自动化测试框架VenusBench-GD解析
  • 3步构建Windows任务栏美学:CenterTaskbar的终极桌面优化指南
  • AI Agents 开源 LLM 简报 (2026年5月6日)
  • 终极GPU显存稳定性测试指南:5分钟掌握memtest_vulkan专业检测工具