三十多个 AI Agent,谁已经凉了
2026 年,写代码这件事真正变的,不是哪个工具又强了一截,而是「人和机器怎么一起干活」这套规则,整个换了逻辑——从替你写代码,到替你办事;从一个个被动的工具,到一支支自己会跑的 Agent。
我把全世界三十多个玩家,摆上了同一张桌子,做了份全景,看清谁在狂奔、谁在掉队、谁已经凉了、只是你还没收到讣告。完整设计版报告带全部坐标图和可视化,链接我放在文末。
看清全局,只要问两个问题
别用「交互式还是自主」「在线还是常驻」去分类——那是用法,不是属性。给 Claude Code 挂个定时任务,它照样自己跑;让一个通用 Agent 陪你聊天,它也是交互式。
能把一个工具钉死在位置上的,是两个它改不掉的问题:一,它是专门写代码的,还是什么都能干的通用 Agent?二,它跑在厂商手里(闭源托管),还是你自己手里(开源自托管)?横轴答第一个,纵轴答第二个,三十多个工具,各就各位。
能力是一层层叠上来的,不是代代替换
AI 编程这几年,是把能力一层一层叠上来的:先会补全,再会对话,然后能跨文件改、能自己调用工具、能扛住一个长任务。新的没把旧的扔掉——你今天用的每个工具,都同时站在这五层之上。
所以「自主 Agent 是质的飞跃」这话,得打个问号。给 Claude Code 挂个定时任务它一样自己跑,「常驻、自己发起」是谁都能配的部署选项,不是某类工具独有的天赋。那些主打常驻的产品呢?它们把常驻、跨会话记忆、几十个消息通道打包成开箱即用,卖的是封装和便利——这本身很有价值,但别把它当成一个新物种。
一年看下来,几条确定的方向
前沿打的是「底座」的仗,不是编辑器的仗:有的平台一口气铺开五个面,有的把界面重做成能并行盯一队 Agent 的工作台、还自己续训模型。
开源不等于永生:一个十万星、社区贡献六千多 PR 的明星项目,说停就停,转头换成闭源继任者;另一个五月直接归档。
中国已经是一套完整谱系:从云端的几家,到能塞进内网私有部署的几家,接 DeepSeek、Qwen、GLM、Kimi、MiniMax 已经是默认配置。云、本地、私有化三条路,都能自洽闭环。
鲜度快照:别选到僵尸项目
工具圈最坑的,是你照着一篇半年前的推荐去选,结果选中一个其实早停更的项目。所以我逐个核了存活状态:
一句话:选工具,先看它最后一次提交是什么时候、许可证是什么,这比看它多少星,实在得多。
普通人到底怎么选
不用被这些名字吓到,就三档:
偶尔用,就云 App,别碰部署,月费十几二十块封顶。想要个真帮手——帮你收邮件、整理、提醒、定时爬信息——上常驻 Agent,用微信、飞书、钉钉遥控,代价是得有一台常开的机器。就爱折腾、想省钱或看重隐私,自托管加本地模型,用 Ollama 跑 Qwen、GLM、DeepSeek 的开源版。
记住三条红线:别裸奔暴露端口;别给它无限权限和你的钱包;别全自动放养。
能力越大,越要把门锁好
这条我想单独拎出来,因为它最容易被忽略,代价也最狠。
常驻 Agent 把「能执行命令、能读文件、能花钱」24 小时挂在网上,这是个全新的攻击面。
不是吓唬你,是真实发生过:某个涨星飞快的常驻 Agent 爆出一个漏洞(评级 CVSS 8.8),你只要随手点开一个恶意网页,攻击者就能通过你本地的浏览器接管这个 Agent——不需要你开端口,不需要公网 IP。安全机构还扫到过二十二万多个实例,就那么裸暴露在公网上。
加固不挑系统,记住几条:能不开端口就不开,让它走纯出站的聊天平台;把浏览器也当成攻击面防;权限给到最小;让它在沙箱里干活;补丁追着打;而删除、发送、付款、发布这种关键动作,必须人在回路里点一下头。
落到一句话
2026 年最要命的问题,从来不是「哪个 Agent 最强」,而是——你的工作流,跑在谁的地基上;你的数据,留在谁手里;出了事,谁来担。
想看那张把三十多个工具摆进同一坐标系的全景图,还有五层能力、场景矩阵、跨系统拓扑、决策树这些完整可视化,去看设计版报告:
https://qiaokezhizao.top/uploads/reports/agent-landscape.html
(本报告由乔氪智造整理。AI 工具迭代极快,版本、星数、定价、安全通告可能在你读到时已经变了,落地前请以官方最新信息为准。)
