当前位置：首页 > news >正文

Claude Dreaming 功能解析：Agent 后台自动提炼经验，Harvey 任务完成率提升 6 倍

news 2026/6/25 11:48:36

Claude Dreaming 是 Anthropic 于 2026 年 5 月 6 日发布的 AI Agent 后台学习机制，通过定期回顾历史会话，自动提炼单个 Agent 无法独立发现的跨任务规律——包括反复出现的错误、团队共同偏好、以及不同 Agent 收敛到的高效工作流。法律科技公司 Harvey 启用 Dreaming 后，任务完成率提升约 6 倍（Anthropic 官方数据，2026 年 5 月）。该功能目前处于 Research Preview 阶段，需申请才能使用。

Claude Dreaming 是什么，工作原理如何

Claude Dreaming 是一个无需人工介入的计划任务，在 Agent 会话结束后异步运行，输入是大量历史 session，输出是提炼出来的模式与偏好，反哺给同一套 Agent 系统。

这个逻辑和人类睡眠时大脑巩固记忆的机制高度相似——海马体在快速眼动期把白天的经历压缩写入长期记忆，Dreaming 则是把 Agent 的"白天经历"在后台系统性消化。

Anthropic 原文描述是："Dreaming surfaces patterns that a single agent can't see on its own, including recurring mistakes, workflows that agents converge on, and preferences shared across a team."

单个 Agent 每次执行任务是孤立的——它不记得上周同样的问题自己犯了什么错。Dreaming 跨 session、跨用户、跨时间地看，是单个 Agent 做不到的视角。Harvey 用 Dreaming 协调法律工作流中的多个任务节点，完成率约提升 6 倍，背后逻辑是：法律流程的错误往往系统性重复，Dreaming 识别并修正一个规律，等于同时修正了所有类似任务。

Outcomes 和多 Agent 编排：同期公测的两个功能

本次 Anthropic Managed Agents 更新共发布四个功能，Dreaming 之外还有 Outcomes 和多 Agent 编排进入公测，以及 Webhooks 上线。

Outcomes（成果评估） 允许开发者用自然语言写评判标准（rubric），Agent 完成任务后自动对照标准自我评估，不达标则重试。Anthropic 测试数据显示：

任务成功率最多提升 10 个百分点
docx 文件生成质量提升 8.4%
pptx 文件生成质量提升 10.1%

写作平台 Spiral 用 Outcomes 强制执行编辑规范，文档审核服务 Wisedocs 用它让质检流程提速 50%（Anthropic 官方数据，2026 年 5 月）。

多 Agent 编排（Multiagent Orchestration） 支持主 Agent 把任务分发给多个专门的子 Agent，各自拥有独立的模型和工具集，并行跑在共享文件系统上，执行过程在 Claude Console 全程可见。Netflix 使用这一方式，跨数百个构建任务并行做日志分析。

Dreaming 为什么是 AI Agent 发展的转折点

AI Agent 首次拥有了无需重新训练即可持续优化的机制，这是 Dreaming 最根本的意义。

过去两年 AI Agent 的核心问题是"能不能用"——稳定完成任务、工具调用不出错、处理多步流程。这些问题基本已有答案。Dreaming 把问题转向了"能不能越用越好"。

人类员工会积累经验，相同的工作做多了会更快更准。以往 AI Agent 每次运行都是全新的，历史经验对下一次任务没有直接帮助。Dreaming 在不重新训练模型的前提下，给 Agent 系统装了一个持续学习的通道。

需要说明的是：Dreaming 目前仍是 Research Preview，技术细节尚未完全公开，Harvey 的 6 倍提升是特定业务场景的数据，不代表所有场景的通用效果。

开发者如何使用这几个新功能

这次发布的四个功能，可用状态不同，接入方式也有差异：

功能	状态	接入方式
Dreaming	Research Preview（需申请）	claude.com/managed-agents 申请
Outcomes	公测（Public Beta）	Claude Platform 直接接入
多 Agent 编排	公测（Public Beta）	Claude Platform 直接接入
Webhooks	正式发布	Claude API 标准端点

底层 API 接入方式没有变化——Claude API 兼容 Anthropic 标准接口，同时支持 OpenAI SDK 格式。国内开发者通过七牛云 AI 的 Anthropic 兼容端点可以访问 Claude 模型，现有代码无需修改。

常见问题

Q：Claude Dreaming 和 Agent 记忆（Memory）有什么区别？
Memory 是 Agent 在单次或多次会话中主动存取的信息，由开发者或用户控制写入和读取。Dreaming 是被动的后台分析过程——它不是 Agent 的"日记"，而是系统级的"复盘"，自动提炼跨 session 的规律，开发者不需要手动管理。两者可以共存，Memory 存储具体信息，Dreaming 提炼结构性规律。

Q：Dreaming 是否会让 Agent 学到"坏习惯"？
这是合理的顾虑。Anthropic 目前没有公开 Dreaming 的具体过滤机制，Research Preview 阶段也有这方面的探索空间。Harvey 6 倍提升的案例说明正向效果是真实的，但复杂业务场景下的边界条件还需要观察。申请内测时可以直接向 Anthropic 询问这一点。

Q：Outcomes 的 rubric 怎么写才有效？
Outcomes 的评判标准用自然语言定义，描述"什么算完成、什么算失败"。Wisedocs 的案例是文档质量审核，规范可以写得非常具体（如"文档必须包含结论段"、"引用格式必须统一"）。越具体的 rubric，Agent 自我评估的准确率越高，重试机制才有意义。

Q：多 Agent 编排和 LangGraph、AutoGen 这类框架有什么关系？
Claude 的 Multiagent Orchestration 是平台层的能力，内置在 Claude Platform 上，执行可见性由 Claude Console 提供，不依赖第三方框架。LangGraph、AutoGen 等框架仍然可以在应用层使用，和 Claude 的原生编排并不冲突，具体选择取决于团队已有的技术栈。

Dreaming、Outcomes 和多 Agent 编排代表了 Anthropic 对 AI Agent 系统设计的整体判断：Agent 需要持续优化机制、自我评估能力和协作执行框架，三者缺一不可。Dreaming 是其中最具突破性的一步——它让 AI Agent 的能力曲线从平线变成了上升线。

据 Anthropic 官方博客（2026 年 5 月 6 日）数据，Harvey、Netflix、Spiral、Wisedocs 均已验证相关功能的实际效果。本文内容基于发布当日信息，建议关注 Anthropic 官网获取功能进展更新。

延伸阅读