当前位置: 首页 > news >正文

Kimi Work 来了:月之暗面发布桌面 Agent,知识工作者的“Vibe Working“时代开启

2026 年 6 月 3 日,国内大模型公司月之暗面(Moonshot AI)宣布了一件大事——面向知识工作者的通用型本地 Agent「Kimi Work」正式开启公测

同一天,OpenAI 把 Codex 接入 ChatGPT。两大头部公司在同一天发布定位相近的桌面 Agent 产品,这绝不是巧合——AI 行业的下一站,已经从"对话"全面转向"干活"

这篇文章不吹不黑,把 Kimi Work 的核心能力、真实定位、适用场景和当前限制,一次性讲清楚。


一句话看明白 Kimi Work

Kimi Work 是月之暗面推出的一款桌面端 AI Agent,常驻你的电脑。你用自然语言描述目标,它就自主拆解任务、调用工具、操作浏览器、整理文件夹,最终交付文档、表格、PPT 等成品

说人话:你不用再"问 AI 怎么做"了,你直接"让 AI 把活干完"

它不是聊天窗口的升级版,而是月之暗面把已经在程序员群体里跑通的 Coding Agent 能力,整体平移到普通知识工作者的桌面


5 个值得重点关注的能力

1. 300 个子 Agent 并行干活

这是 Kimi Work 最炸裂的卖点。它基于底层的 Kimi K2.6 模型,支持最多 300 个子 Agent 同时协作

什么意思?传统 AI 工具是你说一句它做一步,单线程。Kimi Work 是你布置一个任务,它自己拆分出几十上百个分身,每个分身干一件事,最后把结果汇总

典型场景:你让它写一份竞品分析报告,它可能同时派出 10 个 Agent 去查 10 个竞品网站、5 个 Agent 去读你电脑里的产品文档、3 个 Agent 做数据汇总、2 个 Agent 排版。所有事同时进行,10 分钟出 128 页报告

底层 Kimi K2.6 模型还支持连续 13 小时执行、4000+ 次工具调用,长程任务不再是瓶颈。

2. 操作你正在用的浏览器

Kimi Work 内置一个叫Kimi WebBridge的能力——它不是开一个空的 AI 专用浏览器,而是直接操作你当前正在用的浏览器

这意味着:你登录好的网站、保留的登录态、保存的 cookie、订阅的数据看板,Kimi Work 都能用。它就是你"坐在你电脑前的实习生",而不是"在远程服务器上另起炉灶的 AI"。

之前 Claude Cowork 里的 Computer Use 也是这个思路(控制你的屏幕),但 Kimi Work 把它做成了产品级能力,开箱即用。

3. 自带专业技能库(Skills)

Kimi Work 继承了在线版 Kimi Agent 沉淀下来的专业 Skills 和专业数据库,包括:

  • 金融:同花顺、天眼查、世界银行经济数据库
  • 科研:学术论文检索、文献综述
  • 法律:合同审查、条款比对
  • 建站:一键生成响应式网站
  • PPT:自动排版、品牌模板

金融用户不用再头疼怎么买 API、怎么配置数据源。开箱即用是 Kimi Work 的硬指标。

4. 像人一样"一边读文件一边写文件"

Kimi Work 能同时读取多个文件、跨文件做关联分析、最终输出成可交付的成品文件。Word、PDF、Excel、PPT、TXT、Markdown、图片里的文字——都能读懂。

你只需要说:

“读取 ~/Documents/项目A/ 里的所有文件,整理一份 128 页的市场分析报告,输出为 Word 文档。”

它会自己读完、提炼、组装、生成文件、保存到指定位置。

5. 92% 代码由 AI 自主生成

Kimi 工程师在开发 Kimi Work 的过程中,使用 Kimi Code 等 Coding Agent 工具,一周内完成了 Beta 版的 Mac 和 Windows 客户端。累计产出超过5 万行有效代码,其中 92% 由 AI 自主生成

这说明 Kimi Work 不是"PPT 产品"——它本身就是一个 AI Agent 的成功实践案例。一个产品由 AI 写 92% 的代码,这件事本身比产品功能更具说服力。


Kimi Work vs Claude Cowork:到底选谁

Kimi Work 和 Claude Cowork 定位最像(同为桌面 Agent、面向知识工作者),但实际差异不小:

维度Kimi WorkClaude Cowork
厂商月之暗面(Moonshot AI)Anthropic
底层模型Kimi K2.6(开源、Agent 调优)Claude 3.5/4 系列
子 Agent 并行最多 300 个串行为主,逐步支持并行
浏览器操控内置 WebBridge,开箱即用Computer Use(Beta 阶段,权限控制更严)
专业技能内置金融/科研/法律 Skills偏通用,Skills 生态靠社区
编程能力Kimi Code 同源,代码能力极强通用编程够用,复杂工程一般
桌面平台Mac / Windows(Linux 暂无)Mac / Windows / Linux
中文支持原生,中文文档/Skill 更全强但偏英文场景
稳定性Beta 阶段,"一天 N 版"迭代正式版,相对稳定

简单选择建议

  • 重度中文用户、需要中文金融/法律/科研场景 → 优先试 Kimi Work
  • 编程工作流、需要稳定成熟的产品 → 继续用 Claude Cowork
  • 跨境业务、需要英文资料深度处理 → 两者都可以,看团队习惯

真实使用场景:128 页报告是怎么"一键"生成的

月之暗面官方演示了一个典型场景:跨境电商市场分析。

用户输入

“读取电脑文件夹里的产品方案、工业设计原型图和 GTM 方案,调研市场大盘、出海法律法规、竞品生意现状,结合自研看板分析 2400+ 条用户评论,生成一份 128 页的跨境电商市场分析报告。然后调用 PPT Skill,把报告内容和本地设计原型一键转成演示 PPT。”

Kimi Work 的执行流程

  1. 读取产品方案和设计原型(本地文件)
  2. 启动 50+ 个 Agent 并行调研市场大盘
  3. 启动 30+ 个 Agent 查各国出海法规
  4. 启动 50+ 个 Agent 调研竞品
  5. 读取自研看板,分析 2400+ 条用户评论
  6. 把所有信息汇总,生成 128 页 Word 报告
  7. 调用 PPT Skill,把报告转成演示 PPT
  8. 全部保存到指定文件夹

用户做的事:下达任务 + 验收结果。

耗时:原本需要 3-5 人/周的工作,Kimi Work 几小时完成。


客观看待:3 个当前限制

Beta 阶段的产品,看热闹也要看短板:

1. 还很新,稳定性待验证

Kimi 自己说"Kimi Work 正以一天 N 版的速度迭代中"——这意味着功能迭代快,但偶发 bug、任务中途失败的可能性也不低。重要任务别只跑一份,多备份。

2. 只支持 Mac 和 Windows

Linux 用户暂时无缘。服务器端也跑不了,必须有桌面环境。

3. 额度消耗可能不低

300 个子 Agent 并行听起来爽,但每次任务消耗的 token 也多。免费额度估计撑不住重度使用。生产场景大概率需要付费。


我的判断

Kimi Work 不是"另一个 Claude Cowork 模仿者",而是月之暗面把 Coding Agent 的技术沉淀,重新打到知识工作市场的产品

它的真正杀手锏是300 个子 Agent 并行——这个能力来自底层 K2.6 模型的架构突破,不是简单加个并发就能复制的。配合内置的金融/法律/科研 Skills,对中文专业用户来说,Kimi Work 是目前最值得关注的桌面 Agent 选择之一。

但也别忽视它的"还是个 Baby"——月之暗面自己也这么形容。适合尝鲜、值得体验、但重要生产任务先小范围验证

下一步我会持续关注 Kimi Work 的迭代,到时候出一份"上手实测"的文章,告诉你真实使用中的坑和红利。

http://www.jsqmd.com/news/1069525/

相关文章:

  • AI 时代,每个人都需要构建自己的操作系统
  • 【流形学习多模态语言变量分析基础】王阳明代数讲义之元认知透镜
  • 杰理ac791 wifi_camera 工程排坑手册
  • 云耀计算AI-Claura,在树莓派运行的AI
  • 【AI应用实战-WorkBuddy】工作流搭建:从需求到自动化全流程(十三)
  • 第二章 数字类型及其操作3
  • IntelliGit 项目个人工作总结
  • 模型配置篇(子篇)《DeepSeek API Key 获取实操指南:手把手教你拿到“大龙虾”的通行证》
  • 计算机毕业设计之村级技能培训管理系统
  • 微分几何中的等参超曲面与焦点流形稳定性分析
  • 从 Receiver Agreement 看懂 SAP PI/PO 出站路由的最后一公里
  • 秋招倒计时两个月,AI能力要从“会用工具”变成“能讲案例”
  • 为什么很多公司禁用 MyBatis 二级缓存?看完你就不敢乱开了
  • Python 3正则表达式完全指南:从入门到精通
  • 基于 Harmony 6.0 应用的游戏时长统计与防沉迷提醒应用首页实现
  • 金融事件序列建模:PRAGMA Transformer模型解析与应用
  • 2026 AI 开发者生存指南(5):AI Agent 框架对比——LangChain、LangGraph、CrewAI、Dify 怎么选?
  • Tiny Time Mixers (TTMs): Fast Pre-trained Models for Enhanced Zero/Few-Shot Forecasting of Multivari
  • 基于LLM的文本相关性评估:从RAG优化到可持续性分析的工程实践
  • Spring AI 接入 MCP:DeepSeek 连接 Filesystem Server 读取本地文件
  • 复杂流体系统实时控制:模型降阶与滚动时域优化实践
  • DINOv3+LoRA:基于视觉基础模型的图像篡改检测新范式
  • 当AI Agent开始写AI Agent:自进化系统在企业管理中的伦理与安全红线
  • MatRIS-MoE与Janus框架:突破百亿参数通用机器学习原子间势训练壁垒
  • 指纹浏览器指纹工厂(下):基于真实设备数据特征的马尔可夫链生成与校验
  • 广告物料行业实践指南:从制作到落地的全流程解析与未来趋势展望
  • 基于SRAM存内计算的Transformer Softmax硬件加速方案解析
  • 自适应信息流:让视觉语言模型学会动态聚焦的关键技术
  • 小旺 AI 截图:基于多模态大模型的桌面效率工具
  • 大语言模型对齐中的奖励破解问题与CARP框架解析