当前位置: 首页 > news >正文

OpenClaw大版本更新之后,Agent开始向“系统级智能体”演化

关注 霍格沃兹测试学院公众号,回复「资料」, 领取人工智能测试开发技术合集

最近两个月,如果你在用一些新的 AI 工具,应该会有一个很直观的感受:

有些系统,已经不再是“你点一下,它回一句”。

它开始自己跑流程、自己调工具、甚至在你不操作的时候还在持续执行。

问题也随之出现:

  • 有时候结果是对的,但过程完全不可控

  • 有时候能跑通一次,但跑不稳第二次

  • 有记忆,但越用越乱

这类问题,本质上不是模型能力的问题,而是系统形态变了。

这次 OpenClaw 的更新,把这件事讲得更清楚了一步:

AI正在从“被调用的能力”,变成“持续运行的系统”。


目录

  1. OpenClaw这次更新,本质不在功能

  2. 记忆机制正在从“存储”变成“认知”

  3. Agent架构正在向“操作系统形态”演进

  4. Dreaming机制到底解决了什么问题

  5. 对测试的影响,不是工具升级而是边界重写

  6. 下一阶段,谁在被淘汰


一、OpenClaw这次更新,本质不在功能

表面看,这次更新有几个很显眼的点:

  • Dreaming 记忆机制

  • 内置视频 / 音乐生成能力

  • 默认接入 GPT-5.4 + 缓存优化

这些能力单独看,并不稀奇。

关键在于:

它们第一次被组织进“长期运行的Agent系统”。

换句话说:

AI不再是一次请求,而是一个持续存在的执行体

结构上可以这样理解:

核心变化:

  • 执行是循环的,而不是一次性的

  • 记忆参与决策,而不是只做存档


二、记忆机制正在从“存储”变成“认知”

过去很多系统的“记忆”,本质是:

  • 存对话

  • 做向量检索

  • 用RAG补上下文

但 Dreaming 机制做的不是“多存一点”,而是:

重构记忆,让它参与决策。

可以拆成三层:

原始记忆

  • 对话记录

  • 执行日志

  • 工具调用结果

压缩记忆

  • 自动总结

  • 关键信息提取

  • 冗余剔除

结构化认知

  • 用户偏好

  • 任务模式

  • 行为策略

流程如下:

记忆如果不能影响决策,本质上只是日志系统


三、Agent架构正在向“操作系统形态”演进

过去的Agent,大多是这种结构:

Prompt → LLM → 输出

稍复杂一点:

Prompt → LLM → Tool → 输出

但现在已经变成:

核心变化有三个:

有运行时

Agent不再是函数,而是持续运行的进程

有调度

任务可以动态拆解和重排

有状态

系统会记住当前阶段,而不是每次重来

Agent正在从“能力调用”,变成“系统工程问题”

四、Dreaming机制,本质是“离线思考能力”

Dreaming不是简单的“总结”。

它解决的是一个长期问题:

AI在不被调用的时候,是否还能优化自己。

可以类比人:

  • 白天执行任务

  • 晚上整理经验

对应机制:

它解决了三件事:

上下文混乱

通过压缩和结构化保持清晰

Agent不成长

引入经验沉淀机制

重复犯错

让策略层产生记忆

没有Dreaming的Agent,本质是一次性工具


五、对测试的影响,不是工具升级,而是边界重写

很多人还在关注:

  • AI能不能生成用例

  • 能不能写自动化脚本

但问题已经变了。

当系统变成“持续运行的Agent”,测试对象也变了。


从功能验证 → 行为稳定性

你要测的不是结果,而是:

  • 是否进入错误循环

  • 是否产生异常路径


从接口测试 → 决策链路测试

测试对象变成:

输入 → 推理 → 工具 → 记忆 → 再推理

需要验证:

  • 每一步是否可控

  • 是否存在放大效应


从覆盖率 → 系统演化能力

关键问题变成:

  • 记忆是否污染

  • 策略是否漂移

  • 长期运行是否稳定

AI测试的核心,正在从“验证结果”,转向“约束系统行为”


六、下一阶段,谁在被淘汰

当这类系统进入生产环境,会出现一个明显分层:

不会系统的人,很难继续参与。

因为你面对的已经不是:

  • 一个接口

  • 一个模块

而是:

  • 持续运行的Agent系统

  • 带记忆的执行体

  • 会不断演化的结构

再说得更直接一点:

  • 只会写用例,不够

  • 只会调接口,也不够

真正需要的是:

  • 理解系统架构

  • 理解行为路径

  • 理解AI决策机制


最后留一个问题:

你现在在测的系统,是一次性调用模型,还是一个会持续运行、不断演化的Agent系统?

http://www.jsqmd.com/news/625521/

相关文章:

  • Jenkins 学习总结臼
  • 2025届毕业生推荐的六大AI写作网站横评
  • ReadCat小说阅读器:如何打造纯净无干扰的沉浸式阅读体验?
  • 自定义echarts中的tooltip
  • CCF-GESP C++一级考完别急着扔!这份2024年12月真题的‘错题本’帮你吃透考点
  • 【独家首发】AI研发链路追踪成熟度模型(AMM v2.1):覆盖Prompt→Embedding→Rerank→LLM→Action 5大阶段,仅限前500名开发者获取评估工具包
  • 财报OCR识别如何提升信贷审批效率?5分钟完成财报录入
  • 关于 Rust Option 的那些事:从基础到常用 API 全解析
  • WASM沙箱揭秘:如何通过内存隔离与权限控制打造安全堡垒?
  • 不考公也不考研,双非地信本科转开发经验分享
  • 凌思微-LE5010蓝牙开发实战:从环境搭建到程序下载避坑指南
  • 突破浏览器限制:RTSP流在网页端实现毫秒级低延时播放的技术解析
  • 【工具实战指南】旧版HackBar安装与破解全流程解析
  • AI Agent 跑完任务怎么通知你?我写了个微信推送服务蓝
  • zyh20260411总结
  • Helix QAC静态测试工具:从下载安装到编码规范的全流程指南
  • 洞穴民宿的装修材料有哪些?
  • Pixel Script Temple 解决C盘空间难题:生成智能清理与文件分类脚本
  • 别让AI代码,变成明天的技术债菇
  • 为什么要做 GeoPipeAgent憾
  • 如何快速掌握LangGraph:构建智能工作流的5大秘诀
  • 美团面试:为什么要用分布式缓存?本地缓存呢?多级缓存一致性如何保证?萍
  • 大厂 HR 直言:IT 简历里最加分的 3 个项目类型,别乱写
  • 昆仑通态触摸屏按钮控制串口通信实战(附完整脚本代码)
  • 我用 AI 辅助开发了一系列小工具():文件提取工具邮
  • 和AI一起搞事情#:边剥龙虾边做个中医技能来起号盟
  • LLM安全对齐工程白皮书(工业级落地版):覆盖92%企业场景的12项强制校验清单
  • 微信对接OpenClaw的常见问题和解决方案捕
  • 【限时解密】2026奇点大会未发布技术清单:3个AI原生DApp架构范式+2套零知识证明加速方案
  • NewTab-Redirect:3分钟掌握浏览器新标签页完全自定义