当前位置: 首页 > news >正文

Claude Dreaming 功能解析:Agent 后台自动提炼经验,Harvey 任务完成率提升 6 倍

Claude在做梦-Dreaming-Agent-img1

Claude Dreaming 是 Anthropic 于 2026 年 5 月 6 日发布的 AI Agent 后台学习机制,通过定期回顾历史会话,自动提炼单个 Agent 无法独立发现的跨任务规律——包括反复出现的错误、团队共同偏好、以及不同 Agent 收敛到的高效工作流。法律科技公司 Harvey 启用 Dreaming 后,任务完成率提升约 6 倍(Anthropic 官方数据,2026 年 5 月)。该功能目前处于 Research Preview 阶段,需申请才能使用。


Claude Dreaming 是什么,工作原理如何

Claude Dreaming 是一个无需人工介入的计划任务,在 Agent 会话结束后异步运行,输入是大量历史 session,输出是提炼出来的模式与偏好,反哺给同一套 Agent 系统。

这个逻辑和人类睡眠时大脑巩固记忆的机制高度相似——海马体在快速眼动期把白天的经历压缩写入长期记忆,Dreaming 则是把 Agent 的"白天经历"在后台系统性消化。

Anthropic 原文描述是:"Dreaming surfaces patterns that a single agent can't see on its own, including recurring mistakes, workflows that agents converge on, and preferences shared across a team."

单个 Agent 每次执行任务是孤立的——它不记得上周同样的问题自己犯了什么错。Dreaming 跨 session、跨用户、跨时间地看,是单个 Agent 做不到的视角。Harvey 用 Dreaming 协调法律工作流中的多个任务节点,完成率约提升 6 倍,背后逻辑是:法律流程的错误往往系统性重复,Dreaming 识别并修正一个规律,等于同时修正了所有类似任务。


Outcomes 和多 Agent 编排:同期公测的两个功能

本次 Anthropic Managed Agents 更新共发布四个功能,Dreaming 之外还有 Outcomes 和多 Agent 编排进入公测,以及 Webhooks 上线。

Outcomes(成果评估) 允许开发者用自然语言写评判标准(rubric),Agent 完成任务后自动对照标准自我评估,不达标则重试。Anthropic 测试数据显示:

  • 任务成功率最多提升 10 个百分点
  • docx 文件生成质量提升 8.4%
  • pptx 文件生成质量提升 10.1%

写作平台 Spiral 用 Outcomes 强制执行编辑规范,文档审核服务 Wisedocs 用它让质检流程提速 50%(Anthropic 官方数据,2026 年 5 月)。

多 Agent 编排(Multiagent Orchestration) 支持主 Agent 把任务分发给多个专门的子 Agent,各自拥有独立的模型和工具集,并行跑在共享文件系统上,执行过程在 Claude Console 全程可见。Netflix 使用这一方式,跨数百个构建任务并行做日志分析。


Dreaming 为什么是 AI Agent 发展的转折点

Claude在做梦-Dreaming-Agent-img2

AI Agent 首次拥有了无需重新训练即可持续优化的机制,这是 Dreaming 最根本的意义。

过去两年 AI Agent 的核心问题是"能不能用"——稳定完成任务、工具调用不出错、处理多步流程。这些问题基本已有答案。Dreaming 把问题转向了"能不能越用越好"。

人类员工会积累经验,相同的工作做多了会更快更准。以往 AI Agent 每次运行都是全新的,历史经验对下一次任务没有直接帮助。Dreaming 在不重新训练模型的前提下,给 Agent 系统装了一个持续学习的通道。

需要说明的是:Dreaming 目前仍是 Research Preview,技术细节尚未完全公开,Harvey 的 6 倍提升是特定业务场景的数据,不代表所有场景的通用效果。


开发者如何使用这几个新功能

这次发布的四个功能,可用状态不同,接入方式也有差异:

功能 状态 接入方式
Dreaming Research Preview(需申请) claude.com/managed-agents 申请
Outcomes 公测(Public Beta) Claude Platform 直接接入
多 Agent 编排 公测(Public Beta) Claude Platform 直接接入
Webhooks 正式发布 Claude API 标准端点

底层 API 接入方式没有变化——Claude API 兼容 Anthropic 标准接口,同时支持 OpenAI SDK 格式。国内开发者通过七牛云 AI 的 Anthropic 兼容端点可以访问 Claude 模型,现有代码无需修改。


常见问题

Q:Claude Dreaming 和 Agent 记忆(Memory)有什么区别?
Memory 是 Agent 在单次或多次会话中主动存取的信息,由开发者或用户控制写入和读取。Dreaming 是被动的后台分析过程——它不是 Agent 的"日记",而是系统级的"复盘",自动提炼跨 session 的规律,开发者不需要手动管理。两者可以共存,Memory 存储具体信息,Dreaming 提炼结构性规律。

Q:Dreaming 是否会让 Agent 学到"坏习惯"?
这是合理的顾虑。Anthropic 目前没有公开 Dreaming 的具体过滤机制,Research Preview 阶段也有这方面的探索空间。Harvey 6 倍提升的案例说明正向效果是真实的,但复杂业务场景下的边界条件还需要观察。申请内测时可以直接向 Anthropic 询问这一点。

Q:Outcomes 的 rubric 怎么写才有效?
Outcomes 的评判标准用自然语言定义,描述"什么算完成、什么算失败"。Wisedocs 的案例是文档质量审核,规范可以写得非常具体(如"文档必须包含结论段"、"引用格式必须统一")。越具体的 rubric,Agent 自我评估的准确率越高,重试机制才有意义。

Q:多 Agent 编排和 LangGraph、AutoGen 这类框架有什么关系?
Claude 的 Multiagent Orchestration 是平台层的能力,内置在 Claude Platform 上,执行可见性由 Claude Console 提供,不依赖第三方框架。LangGraph、AutoGen 等框架仍然可以在应用层使用,和 Claude 的原生编排并不冲突,具体选择取决于团队已有的技术栈。


Dreaming、Outcomes 和多 Agent 编排代表了 Anthropic 对 AI Agent 系统设计的整体判断:Agent 需要持续优化机制、自我评估能力和协作执行框架,三者缺一不可。Dreaming 是其中最具突破性的一步——它让 AI Agent 的能力曲线从平线变成了上升线。

据 Anthropic 官方博客(2026 年 5 月 6 日)数据,Harvey、Netflix、Spiral、Wisedocs 均已验证相关功能的实际效果。本文内容基于发布当日信息,建议关注 Anthropic 官网获取功能进展更新。


延伸阅读

  • Anthropic 原文:claude.com/blog/new-in-claude-managed-agents
  • Claude API 国内接入:https://portal.qiniu.com/ai-inference/api-key
http://www.jsqmd.com/news/771373/

相关文章:

  • 工业电子液位计品牌排行|国际一线 + 国产高性价比精选 - WHSENSORS
  • 水下数据中心运维专家养成记
  • 基于Electron构建多模型AI聚合工具:LLM-God桌面应用开发解析
  • SerialPortAssistant跨平台串口通信解决方案:高性能串口调试工具技术实现
  • 杭州高端西装定制选购指南!2026年五大口碑品牌权威排名 - 西装爱好者
  • ThingsBoard MQTT数据上报进阶:如何设计高效的遥测数据JSON结构?
  • Windows上直接运行APK的终极指南:告别模拟器的完整解决方案
  • 2026年5月积家官方高端腕表专业维修售后检修保养服务体系迭代全国统一官方服务热线及联保服务规则正式更新 - 速递信息
  • 2026年苏州能寄宿的私立民办学校选择参考 - 品牌排行榜
  • Cursor智能体管家:AI编程配置标准化与团队协作实践
  • NGA论坛终极优化指南:如何用一款脚本打造完美浏览体验
  • 2026年短视频运营及推广服务机构推荐:兰州元素信息科技有限公司,提供短视频运营/宣传运营/推广运营等全链路服务 - 品牌推荐官
  • 2026年合肥短视频代运营与AI全网推广完全指南:从账号冷启到商业转化的闭环方案 - 企业名录优选推荐
  • 2026年合肥短视频运营与AI全网推广:企业获客引擎完全指南 - 企业名录优选推荐
  • 物联网边缘计算实战:基于IOnode构建轻量级数据流处理节点
  • 腾讯云Agent Memory登顶2026主流方案首选榜 - 领先技术探路人
  • FastbootEnhance:Windows上最直观的Fastboot工具箱与Payload提取器完整指南
  • 晋城搬家全场景痛点解析:找到靠谱服务商才省心 - 奔跑123
  • 指令微调数据集全解析:从Alpaca到LLaVA的实战指南
  • 用啤酒和牛奶讲明白:Ecoinvent里Cutoff、Consequential、APOS模型到底在算啥?
  • 晋城搬家服务技术解析:合规流程与专业标准指南 - 奔跑123
  • 2026年AEO认证咨询推荐及企业合规服务解析 - 品牌排行榜
  • 从零构建AI Agent框架:PicoClaw项目详解与核心模块实现
  • 2026年5月东莞定制塑胶模具/定制注塑模具/塑胶精密模具/塑料精密模具/精密塑胶模具厂家哪家好,选东莞市时光电子科技有限公司 - 2026年企业推荐榜
  • 山东大学软件学院项目实训-创新实训-计科智伴(四)—— 后端第四周:智能互动 + 练习模块
  • 2026上海普拉提机构排行榜:高性价比机构推荐 - 品牌2025
  • 2026年太原短视频代运营与企业全网营销深度指南 - 优质企业观察收录
  • 查看 Taotoken 账单明细了解各模型与项目的详细资源消耗
  • 2026通风设备厂家推荐及行业应用解析 - 品牌排行榜
  • 2026年熟地黄深度测评:如何为你的养生需求匹配最佳方案? - 速递信息