把钉钉打碎,阿里炼出了「悟空」,给企业配了一支龙虾军团
今天,阿里钉钉发布了一个叫「悟空」的产品。
这是钉钉成立 11 年以来推出的首款独立 APP,面向全球公测,是一个全新的、独立的 AI Agent 产品。
虽然龙虾产品今年多到审美疲劳了,多一个能帮你写代码、改文档、操控电脑的 AI 助手不稀奇,但是为了这个产品,可以把原来服务 8 亿用户、稳定的产品拆了,这个事不常见。
钉钉刚刚干了这件事。
悟空有手机和电脑两个端。一个很直觉的用法是——你掏出手机跟它说句话,电脑那头就开始干活了,做完直接给你交付成果。
我在电脑上试了一下:让它帮我做一个英伟达 20 年之间的股票变化动画。它自己主动打开浏览器搜素材,装好依赖,写完代码,动画就跑出来了。
全程没碰键盘。当然处理 Word、PDF、表格这些日常文档是基本功。
悟空有一个技能广场,里面按行业备好了一整套技能包。
比如你是做跨境电商的,装上电商相关的技能包,从选品、找货源、写商品文案到生成营销视频,它能帮你跑通一整条链路。同样的思路还有一人律所、一人设计团队、一人知识博主……钉钉管这套叫OPT,One Person Team,一人团队。
一个人加上悟空,能干原来一个小团队的活。
在发布会上,悟空演示了一个「一人跨境电商」的场景。
输入一个产品关键词 dog bed,先从亚马逊搜索行业热搜数据,把高流量关键词埋进商品标题做 SEO 优化,然后批量生成商品展示图,把标题和图片填进钉钉表格,最后设一个每天自动执行的监控任务,看商品的点击率。一条链跑路下来,搭了一套跨境电商 SOP。
正好我们团队有个小伙伴最近碰上了一件头疼的事,在处理一个软件著作权被侵权的案件。本来是自己 Vibe Coding 的一个方便用户创作小说的产品,没想到竟然扯上了官司。
因为完全没有法律背景,对接已经让他头疼好几天了,比如连“庭审发问策略”这几个字都是第一次听说。
把案件相关的证据材料:律师函、时间轴、开源仓库记录、法律警告函这些全扔进了悟空的工作文件夹。然后跟它说了一句话:
准备一下庭审发问策略,证据目录就在工作文件夹。
报告有七个部分:案件分析、争议焦点拆解、向对方发问设计(7 个关键问题,每个都有预设答案和追问方案)、法官发问预判、对方策略预判、应答准备、庭前清单。
他拿给一个律师朋友看了一眼,他直接来了一句“这是你问 AI 的吗?效果不错”。
一个没有任何法律背景的人,扔了一句话和一堆文件进去,拿到了一份结构完整、论点清晰的庭审策略报告。全程大概十几分钟。
这就是“一人律所”的意思。不是说悟空能替代律师,而是一个人加上悟空,至少能让你在见律师之前,先搞清楚自己的案件到底怎么回事。
上面是你打开悟空能直接感受到的部分。但是我在文章开头说了这是钉钉下了一场豪赌。
赌的不是这些功能,是为了做这个产品,钉钉对自己动的那一刀。
现在 AI 操作文件的方式普遍是,你让 AI 改一个 Word 里的错别字,它实际做的事情是——把整篇文档读进来,改那一个字,再把整篇文档写回去。做一个 PPT,Token 能消耗 2.7 亿。。而且改坏了没有撤回,只能从头再来。文件存哪了,散落各处没人知道。
虽然模型的脑子够用了,但手脚太笨。
所以,钉钉先解决了“手”的问题。
他们从零搭建了一套文件系统,叫RealDoc,定义为 AI 原生文件系统。AI 可以按行号定位,按关键词锚点、用正则表达式批量匹配,只动需要动的地方,不碰其他内容。而且,AI 每改一步,系统自动存一份完整快照,类似游戏里的自动存档。改坏了一条命令回退,还能对比两个版本之间到底改了什么。
下一件事更激进,让 AI 能直接调动钉钉。
你想让 AI 帮你在钉钉里发消息、建审批、排日程,上周我的做法是装一个 Skill,让 AI 操控电脑,看屏幕、找按钮、模拟点击。
上周我试过一种方式,让它找到找到编辑部的工作群,发一条消息,它干了 10 分钟,其实我自己 10 秒钟能干了。
钉钉的实现方式完全不一样。
把钉钉所有产品能力——IM、文档、日程、审批、会议、表格——全部重写成命令行指令,也就是全面 CLI 化,全部命令行化了。可以通过一条文本指令直接调用,不再需要看屏幕找按钮。发消息,一条指令,建审批,一条指令,排会议,一条指令,直接说一句话就调用了钉钉的能力。
这就是豪赌的赌注所在。
把一个服务八亿用户的成熟产品,从底层拆开重写一遍代码,代价很大,也没有回头路。
如果赌对了,回报也是决定性的。
悟空能调动的就不只是你电脑上的几个软件,几个文件,而是钉钉 11 年沉淀的全量协同能力。而且阿里集团旗下淘宝、天猫、支付宝、阿里云的商业能力也在逐步接入。一个人加上悟空,能调动的资源深度,和一个 AI 单纯帮你操控电脑,不是一回事。
悟空目前是邀测状态,产品还在快速迭代。阿里给它的定位是 AI 原生工作平台。面向企业的安全管控、权限审计这些能力是整套设计中很重要的一层,也是后面会持续释放的部分。
AI Agent 赛道今年所有人都在拼谁更聪明、谁能干的事更多。
大部分产品选的是在模型和功能层不断叠加——更强的模型、更多的 Skill、更炫的演示。
OpenClaw 确实让人真切地体会到 AI24 小时干活是什么意思,但是用过一阵后会发现,它只是一个暴露在公网上工具箱,Skill 谁都能发布,装之前没有任何安全审核;你的文件、你的账号密码、你的 API Key,Agent 拿到就直接用了,你甚至不知道数据被传到了哪里。之前就有安全团队扫描发现,公开市场上数百个 Skill 里混进了大量恶意代码,而大部分用户根本没有能力分辨。
但企业不是一个人。企业有组织架构、有权限层级、有审批流程、有合规底线,AI 要在企业里真正干活,就必须在一套规则里运行,而且每一步操作都在企业的权限范围内执行,每一个动作都可追溯、可审计。
钉钉选了一条最重、最慢、也最难被复制的路——企业级 AI 原生工作台。
不只是重写底层代码让 AI 能调用钉钉的能力,还要让 AI 在企业的规则体系里安全地干活。
前者是技术工程,后者是信任。你会选择哪一个呢?
