当前位置: 首页 > news >正文

从腾讯 Marvis 看 MateClaw:企业级 Agent Harness OS 应该怎么落地

写于 2026 年 5 月 21 日。
说明:本文不是腾讯 Marvis 与 MateClaw 的合作说明,也不是产品对标稿。Marvis 的公开资料提供了一个很好的观察窗口:AI Agent 正在从“聊天框”走向“设备、文件、工具和任务执行层”。本文基于这个趋势,结合 MateClaw 源码中已有的实现,聊聊企业级 Agent Harness OS 应该怎么做。


1. Marvis 带来的信号:AI 助手开始进入操作系统层

过去一年,很多 AI 产品都在卷“谁的模型更会回答”。但腾讯 Marvis 这一类产品释放出的信号不太一样:AI 不再只停留在网页聊天框里,而是开始进入电脑、手机、本地文件、系统设置、应用操作和跨端远程控制。

公开资料里,Marvis 的关键词很集中:

  • 操作系统级 AI 助手;
  • 多 Agent 分工协作;
  • Supervisor 负责拆解和派单;
  • 本地文件、图片、文档索引;
  • 手机连接 PC,远程查看和接管任务;
  • 隐私模式下文件不上云;
  • 对敏感操作做强确认;
  • 用拟人化工位 UI 让用户看到“谁在干活”。

这说明 Agent 产品的竞争焦点正在变化。

过去的 AI 助手更像“会聊天的大脑”。下一阶段的 AI 助手更像“能干活的系统”。它不仅要理解用户意图,还要知道自己能不能做、该用哪个工具做、做到哪一步了、要不要用户确认、失败后怎么恢复。

这也是 MateClaw 一直在做的方向:不是再造一个聊天框,而是构建一个能承载数字员工、工具调用、审批治理、跨渠道协作和企业部署的 Agent Harness OS。

2. MateClaw 和 Marvis 的不同:一个偏个人 OS Agent,一个偏企业 Agent 运行平台

Marvis 的产品叙事更接近个人设备上的 OS Agent:用户说一句话,它能操作电脑、手机、文件和应用。它强调的是“把个人电脑交给 AI 帮你处理”。

MateClaw 的方向不完全一样。

MateClaw 更像企业里的 Agent 运行平台。它要回答的问题不是“AI 能不能帮我关掉电脑设置”,而是:

  • 一个团队能不能创建多个数字员工?
  • 每个数字员工能不能绑定不同技能和工具?
  • 高危工具调用能不能审批?
  • 审批后任务能不能继续执行?
  • 任务过程能不能流式展示和持久化?
  • Web、飞书、钉钉、Slack、QQ、企业微信里的会话能不能统一进入同一套 Agent 运行时?
  • 本地模型、云端模型和企业自部署模型能不能统一接入?
  • 能不能在 Java / Spring Boot / MySQL / Flyway / RBAC 这些企业熟悉的技术栈里长期运行?

所以,与其说 MateClaw 要“复制 Marvis”,不如说 Marvis 验证了一个大方向:

AI Agent 的价值正在从回答问题,转向可治理的任务执行。

而 MateClaw 要把这个方向放进团队和企业场景里。

3. Supervisor 调度:MateClaw 已经有 Plan-and-Execute 骨架

Marvis 公开资料里最值得借鉴的一个产品点,是“主管 + 专家 Agent”的调度感。用户不是只看到一段流式文字,而是能看到一个团队正在分工。

MateClaw 源码里已经有对应的技术基础。

/Users/mate/Codes/mate/mateclaw/mateclaw-server/src/main/java/vip/mate/agent/graph/plan/StateGraphPlanExecuteAgent.java中,MateClaw 使用 StateGraph 实现 Plan-and-Execute Agent。整体流程是:

用户目标 → PlanGenerationNode 判断任务类型并生成步骤 → StepExecutionNode 执行当前步骤 → 工具调用 / 审批 / 结果持久化 → 最终汇总

PlanGenerationNode负责分流:纯问答直接回答,单步工具任务压成单步,多步复杂任务拆成 2 到 6 个可执行步骤。StepExecutionNode则负责逐步执行,并在内部完成工具调用、Token 统计、超时保护和审批触发。

这意味着 MateClaw 短期最值得做的产品增强,不一定是重写 Agent 框架,而是把已有的执行状态展示出来。

例如在 Chat Console 里做一个“团队视图”:

  • 规划员:正在拆解任务;
  • 执行员:正在执行第 2 步;
  • 工具专家:正在调用搜索、文件或脚本工具;
  • 安全官:等待用户审批;
  • 汇总员:正在生成最终报告。

这类 UI 不只是好看,它会显著降低用户对长任务的焦虑。企业用户最怕的不是 AI 慢,而是不知道它在做什么。

4. Tool Guard:OS 级操控必须先有安全边界

Marvis 资料里有一个很关键的点:涉及资金交易、系统核心配置修改、批量删除文件等敏感操作时,需要强确认。

这是所有“AI 接管设备”产品绕不开的问题。

如果一个 Agent 只能聊天,风险还可控;一旦它能执行命令、写文件、跑 SQL、改配置,安全模型就必须先于功能设计。

MateClaw 这部分已经有比较清晰的基础。

/Users/mate/Codes/mate/mateclaw/mateclaw-server/src/main/java/vip/mate/tool/guard/DefaultToolGuard.java中,MateClaw 对工具调用做了分级:

  • 极端破坏性操作直接 BLOCK,例如格式化磁盘、删除根目录、管道下载脚本执行;
  • 高风险 shell 操作进入 NEEDS_APPROVAL;
  • shell 执行默认需要审批;
  • 文件写入、编辑、定时任务创建和删除也默认需要审批。

同时,ToolGuardEngine又把安全判断抽象成 Guardian + PolicyResolver 的结构:Guardian 产出风险发现,PolicyResolver 决定最终动作。这比单纯写几个 if 判断更适合企业扩展。

未来如果 MateClaw 桌面端要做 OS 工具包,例如:

system.getInfo system.changeSetting system.cleanCache app.launch file.search file.move

这些工具应该天然绑定 Tool Guard,而不是等功能做完再补安全。

5. 审批与恢复:企业 Agent 不只要能停,还要能继续跑

很多 Agent 产品的审批只做到“弹一个确认框”。但企业任务更麻烦:用户确认之前,任务状态在哪里?页面刷新后审批还在不在?审批通过后能不能从原来的步骤继续执行?审批拒绝后上下文怎么收束?

MateClaw 在这块有两个重要实现:

  • ApprovalController提供待审批记录查询,用于页面刷新后的审批恢复;
  • StateGraphPlanExecuteAgent.chatWithReplayStream()能在审批后恢复 awaiting approval 的计划上下文,并继续执行原计划。

这意味着 MateClaw 的审批不是简单的前端弹窗,而是运行时的一部分。

对企业来说,这一点很关键。因为真实任务往往不是“一问一答”,而是:

生成计划 → 读取资料 → 查询数据库 → 发现需要写文件 → 等待审批 → 审批通过 → 继续写文件 → 生成报告 → 推送到渠道

如果审批会打断整个任务,Agent 就很难承担真实工作。MateClaw 的优势在于,它已经把“等待人确认”纳入了 Agent 执行生命周期。

6. 多渠道不是聊天入口,而是任务现场

Marvis 强调跨端接管:手机可以查看 PC 任务执行画面,并在需要时接管。

MateClaw 当前不是同一种形态,但已经有“多渠道任务现场”的基础。

在源码里,MateClaw 有:

  • ChannelMessageRouter:多渠道消息路由;
  • ChannelSessionEntity:维护不同渠道会话和推送目标;
  • ChatStreamTracker:Web Console 侧的流式事件追踪;
  • 飞书、钉钉、Slack、QQ、Telegram、Discord、企业微信等 channel adapter;
  • approval notification:审批可以进入不同渠道。

现在每个渠道更像独立会话。下一步可以借鉴 Marvis 的“接管”思路,做成任务级订阅:

一个 taskId → Web Console 创建任务 → 飞书/钉钉/QQ 可订阅同一任务进度 → 手机端收到审批卡片 → 用户确认后任务在原运行时继续

这会让 MateClaw 从“多渠道聊天”升级为“多渠道协同执行”。

7. 场景化模板包:不要只卖 Agent,要卖可用场景

Marvis 的另一个产品启发是:它没有一上来让普通用户自己搭工作流,而是给出一组开箱即用的场景。

这点对 MateClaw 同样重要。

MateClaw 现在已经有 Skill Market、Skill Template Wizard、Skill Installer、GitHub / ZIP / ClawHub 安装链路。源码里的SkillTemplateControllerSkillTemplateServiceSkillInstaller都说明这套基础设施已经存在。

但面向用户时,不能只讲“你可以安装 skill”。更好的表达是提供场景包:

  • 打工搭子:日报、周报、会议纪要、资料整理;
  • 知识管家:知识库问答、文档蒸馏、引用总结;
  • 运维助手:日志分析、服务巡检、告警解释;
  • 编码搭子:代码阅读、测试建议、变更说明;
  • 内容运营:选题分析、素材整理、跨平台分发;
  • 数据分析员:表格清洗、趋势分析、报告生成。

每个场景包都应该包含:

  • 预置 Agent;
  • 预置 Skills;
  • 预置 SOUL.md / 系统提示词;
  • 推荐模型;
  • 推荐工具权限;
  • 默认 Tool Guard 策略;
  • 示例任务。

这样用户拿到的就不是零件,而是一套能直接运行的工作方式。

8. 隐私模式:把本地模型能力包装成用户能理解的开关

Marvis 资料里反复强调端侧隐私模式:文件不上云、本地推理、本地处理。

MateClaw 的技术基础也已经具备一部分。源码中可以看到 Ollama 自动发现逻辑,模型配置层也支持多 provider。此前 MateClaw 已经在文档和架构中提到 Ollama、LM Studio、MLX、llama.cpp 等本地模型路径。

但产品上还可以再前进一步:不要只把它藏在 provider 配置里,而是做成用户能理解的“隐私模式”。

例如:

隐私模式开启后: - 默认路由到本地模型 provider; - 禁用云端 STT / TTS; - 本地文件索引不上传; - 图片 / 文档解析优先使用本地能力; - 外部搜索、联网工具需要二次确认; - 所有本地文件访问写入审计日志。

这不是单纯的功能开关,而是把分散的本地能力包装成一个清晰的产品承诺。

对于企业客户,尤其是处理代码、合同、客户资料、内部知识库的团队,这个开关会比“支持某某 provider”更容易理解。

9. 本地资产语义索引:价值高,但应该后置

Marvis 在本地图片、文档、截图语义搜索上很有吸引力。用户不需要记文件名,只要描述内容,就能找到对应文件。这是个人电脑场景里非常强的入口。

MateClaw 也可以做,但我建议优先级不要放太前。

原因是这块工程量大,而且企业要求更复杂:

  • 文件权限如何继承工作区权限?
  • 图片 OCR 和多模态 embedding 用本地还是云端?
  • 增量索引如何处理?
  • 用户删除文件后索引如何同步?
  • 敏感目录如何排除?
  • 多用户、多工作区如何隔离?
  • 审计日志如何记录?

更稳的路线,是先把它作为新的 Wiki Provider:

Local Documents Provider Local Images Provider Local Screenshots Provider

它们不直接变成一个“万能本地扫描器”,而是通过 MateClaw 已有的知识库、权限、工具和审计体系接入。

这符合 MateClaw 的产品气质:宁愿慢一点,也要让企业能放心启用。

10. 我建议 MateClaw 的三个短期产品动作

结合 Marvis 的启发和 MateClaw 当前源码基础,短期最值得做的不是大改架构,而是把已有能力产品化。

第一,做 Plan-Execute 团队视图

把已有的plan_createdplan_step_startedplan_step_completed等事件展示成可视化团队状态。

用户看到的不只是文字流,而是一个任务团队:

  • 谁在规划;
  • 谁在执行;
  • 哪一步等待审批;
  • 哪一步已经完成;
  • 哪一步失败或重试。

这是低成本、高感知的改动。

第二,做隐私模式开关

把 Ollama / LM Studio / MLX / 本地模型、本地语音、本地文件访问、联网工具确认统一包装成“隐私模式”。

技术上是配置路由,产品上是信任承诺。

第三,做场景化 Agent 模板包

基于 Skill Template Wizard 和 Skill Installer,推出一批一键安装场景:

  • 打工搭子;
  • 知识管家;
  • 运维助手;
  • 编码搭子;
  • 内容运营;
  • 数据分析员。

这会比“你可以创建 Agent 和 Skill”更容易让用户上手。

11. 更长期的方向:桌面端 OS 工具与跨端接管

Marvis 的 OS 级操控和跨端接管,确实是桌面 Agent 的高价值方向。

MateClaw 如果要往这个方向走,应该依托mateclaw-desktop,但需要坚持两个原则:

第一,所有 OS 操作都必须先经过 Tool Guard。

第二,所有跨端接管都应该围绕 taskId,而不是围绕“某个聊天窗口”。

这样未来的 MateClaw 桌面端可以形成这样的体验:

用户在 Web Console 发起任务 → 桌面端执行本地文件和系统工具 → 手机 IM 渠道订阅任务进度 → 高危操作推送审批卡片 → 用户确认后任务继续 → 结果回写 Web Console 和企业渠道

这不是简单做一个桌面 AI,而是把桌面、Web、IM、审批和企业运行时连成一个闭环。

结语:Agent 的下一站不是更会聊,而是更可托付

Marvis 的出现说明,用户对 AI 助手的期待正在变高。

用户不再满足于“帮我写一段文字”。他们会希望 AI 能看懂文件、操作应用、处理任务、跨端协作,并在关键节点主动确认。

但在企业场景里,仅仅“能操作”还不够。

企业需要的是:

  • 能规划;
  • 能执行;
  • 能调用工具;
  • 能审批;
  • 能恢复;
  • 能审计;
  • 能跨渠道;
  • 能本地化部署;
  • 能被团队长期管理。

这就是 MateClaw 的机会。

如果说 Marvis 代表了个人 OS Agent 的一个方向,那么 MateClaw 可以代表另一条路线:

面向团队和企业的 Agent Harness OS,让 AI 不只是会回答,而是能在边界清晰、过程可见、风险可控的前提下,真正把事情做完。

相关链接

  • 腾讯 Marvis 官网:https://marvis.qq.com/
  • 新浪财经关于 Marvis 的报道:https://finance.sina.com.cn/stock/t/2026-05-19/doc-inhymcpp2309744.shtml
  • 新浪科技 / 爱范儿 Marvis 体验报道:https://finance.sina.com.cn/tech/roll/2026-05-19/doc-inhymumf2200261.shtml
  • MateClaw GitHub:https://github.com/matevip/mateclaw
  • MateClaw 官网:https://claw.mate.vip
  • MateClaw 文档:https://claw.mate.vip/docs
  • MateClaw 在线演示:https://claw-demo.mate.vip
http://www.jsqmd.com/news/861763/

相关文章:

  • 2026年5月钛蒸发循环泵品牌排行:自吸污水泵、自吸离心泵、蒸发强制循环泵、蒸发混流泵、蒸发结晶循环泵、蒸发轴流泵选择指南 - 优质品牌商家
  • Unity编辑器性能优化:工作流、场景与预制体三大资源创建瓶颈
  • 干翻特斯拉?雷军说输给特斯拉不丢人
  • 基于魔珐星云打造的AI女友数字人:甜美陪伴、秒回消息、语音随时交互
  • AI人工智能行业的未来:AI将如何改变我们的生活和工作
  • UE5 BaseEngine.ini深度解析:引擎启动固件与配置原理
  • 【Kafka笔记】(三)常用命令整理
  • Sa-Token客户端ID不匹配报错的根因与修复指南
  • Unity编辑器资源创建性能优化:从Prefab到场景的序列化治理
  • OpenSSH 9.6P1升级实战:修复CVE-2023-51385内存越界漏洞
  • 12个优质播客音乐素材网站,解决你缺BGM的烦恼
  • SoapUI SOAP测试实战:WSDL解析、断言调试与Mock服务配置
  • UE5 BaseEditorSettings.ini 源码级解析与配置优先级链
  • Unity Addressable热更新深度整合实战指南
  • 生完二胎脾胃垮掉,我是怎么用食养调理重新养好的?
  • UE5 BaseEditorSettings.ini深度解析:编辑器行为失控的根源与修复
  • GNSS信号丢了也不怕:这款组合导航系统真硬核
  • TEMU运营干货|凌风图片空间实操指南,小白也能轻松上手
  • Gemini 3.5 Flash 深度评测:性能解析与高效接入实践
  • 安川高负载大容量伺服电机 SGMVV-2BA3B6D
  • 对比Token Plan与按量计费哪种方式更节省成本
  • SPI通信优化:硬件SPI vs 软件SPI的对比与选型
  • VHS Pro深度解析:Unity中模拟真实录像机信号链的原理与实践
  • 【Kafka笔记】(四)Kafka 三种消费模式
  • 赢胜智能:2026 小满
  • 书匠策AI:让毕业论文从“熬秃头“变成“点一下“的黑科技全解读
  • 美国签证预约机器人:3分钟掌握24小时智能抢号终极方案
  • 【状态估计】基于UKF法、AUKF法、EUKF法电力系统三相状态估计研究(Matlab代码实现)
  • SQLmap安装与实战避坑指南:从环境诊断到漏洞利用
  • 解锁Midjourney大画幅秘密:3步实现电影级宽幅输出(含17组实测--ar 16:9至32:9全适配prompt模板)