当前位置: 首页 > news >正文

ClaudeSkills解决了什么问题?还有哪些问题没解决?

Claude Skills 解决了什么问题?还有哪些问题没解决?

Anthropic 的 Claude Skills 是优秀的工程方案,但它解决的是"单一超级 Agent"路线上的模块化补救。本文从工程师视角分析 Skills 的边界,并探讨"原生多 Agent 矩阵"作为另一条路的可能性。


写在前面

2025 年 Anthropic 推出 Claude Skills 之后,AI 应用圈讨论了一波。我看到很多技术博客在介绍 Skills 怎么用、能做什么,但很少有人在问:

“Skills 到底解决了什么底层问题?还有哪些问题它没解决?”

这篇文章想从一个工程师的角度聊聊这个问题。


一、Skills 解决了什么?

简单回顾一下 Skills 的设计:

Claude Skills 让你把"专业能力"打包成可按需加载的模块。Claude 在执行任务时会动态决定加载哪些 Skills,而不是把所有能力都塞进主上下文。

它的核心解决方案是:降低主上下文的负担

具体解决的是 3 个问题:

1. 提示词冗长难维护

一个号称"什么都能干"的 Agent,提示词动辄数千上万字。Skills 让你把每个能力的提示词独立出来,主上下文不必装载。

2. 工具列表爆炸

当工具数量超过 30+ 个,LLM 的工具选择准确率显著下降(research 已证明)。Skills 让你按需加载工具子集。

3. 上下文窗口被吃光

GPT-4o 的 128k 窗口听起来很大,但塞完所有规则 + 工具描述 + 历史对话,能用来思考的空间所剩无几。Skills 让主上下文只装"当前需要的"。

这是 Anthropic 工程团队的优雅解决方案,我必须给个赞。


二、Skills 没解决什么?

但 Skills 的起点是什么?是“我已经有一个超级 Agent 了,怎么让它别撑死”

它的本质是“在单一 Agent 路线上做模块化补救”

这意味着:

1. 它没解决"单一 Agent 反复做同一类任务效率低"的问题

哪怕加载了正确的 Skill,Agent 每次执行任务还是要:

  • 加载 Skill
  • 在主上下文里融合 Skill 描述
  • 选工具
  • 执行
  • 卸载

对于反复执行的"具体任务"(比如发小红书),这个开销是真实的

而真正想用 AI 工具的用户,恰恰是要它反复做同一类事。

2. 它没解决"用户认知模型不匹配"的问题

Skills 是给开发者用的概念。普通用户根本不理解"我装了一个 Skill 之后 Agent 就会更聪明"——他们只想要"一个能发小红书的工具"。

Skills 是工程概念,不是产品概念

3. 它没解决"工程化封装层"的问题

模板系统、品牌包、多平台预填、定时任务、内置浏览器…这些都是工程层的事,不是 Skills 能覆盖的。

Skills 解决的是"模型/Agent 层的工程化"。
不是"产品/用户层的工程化"。


三、另一条路:原生多 Agent 矩阵

我最近一直在思考:如果 Skills 是单一 Agent 路线上的补救,那有没有另一条路?

答案是:原生分工

这条路的设计哲学是:

  • 不堆一个超级 Agent
  • 一开始就建几十个垂类 Agent
  • 每个 Agent 只管一件事
  • 每个 Agent 提示词聚焦、工具精简、又快又稳
  • 用户用的时候直接进入对应的 Agent,而不是"通用 Agent + 加载 Skill"

这是从产品架构层就做了分工


四、案例:TipKay 的多 Agent 应用中心

我用一个具体的产品举例:TipKay(国产 AI 工具)。

它的应用中心结构是这样的:

TipKay 应用中心 ├── 通用 Agent(兜底) ├── 小红书博主 Agent(专精小红书内容创作 + 预填发布) ├── 知乎博主 Agent(专精知乎长文) ├── 博客发布助手(专精四大博客平台格式适配) ├── 文章配图 Agent(专精图文搭配) ├── 首页助手 Agent(专精落地页内容) ├── Context Assets 助手(专精品牌资产管理) └── 用户自建 Agent(用 Agent App 编辑器创建)

每个垂类 Agent 都是这样设计的

  • 提示词 ≤ 1000 字(聚焦一个领域)
  • 工具数量 ≤ 10(只挂相关工具)
  • 不依赖 Skill 加载逻辑
  • 用户直接选择 Agent,不用"先加载 Skill"


五、对比:单 Agent + Skills vs 多 Agent 矩阵

这两条路都能跑,但目标人群和场景不同

  • 单 Agent + Skills:开发者、灵活度高、跨域任务
  • 多 Agent 矩阵:普通用户、垂类深度任务、可预期的工作流

六、为什么我觉得多 Agent 矩阵更适合中文创作场景?

中文创作者的工作流是高度可预期的

  • 写小红书 → 用小红书博主 Agent
  • 写博客 → 用博客发布助手
  • 写知乎 → 用知乎博主 Agent

这些都是反复执行的具体任务。用户不需要"灵活的通用 Agent"——他们需要"快、稳、不出错"。

多 Agent 矩阵在这种场景下是降维打击

而 Skills 路线更适合"灵活的、跨域的、研究性的"任务,比如:

  • 程序员一会儿写代码、一会儿读论文、一会儿调 API
  • 研究员要做 deep research,需要灵活组合各种能力

两条路都对,关键看你服务的是谁


七、写给做 AI 工具的同行

如果你在做 AI 应用产品,建议想清楚 3 个问题:

  1. 你的用户是开发者还是普通人?

    • 开发者用 Skills 没问题
    • 普通人需要"开箱就用的专业 Agent"
  2. 你的核心场景是"灵活组合"还是"反复执行"?

    • 灵活组合 → 单 Agent + Skills
    • 反复执行 → 多 Agent 矩阵
  3. 你想做"工具"还是"成品"?

    • 工具 → 提供能力,让用户自己组合
    • 成品 → 直接交付结果,最后一步用户确认

TipKay 选了"普通人 + 反复执行 + 成品交付"三个组合,所以它走多 Agent 矩阵这条路。这是产品定位决定的,不是技术优劣决定的。


结语

Anthropic 的 Skills 是优秀的工程方案。
TipKay 的多 Agent 矩阵是另一种思路。

它们不是对立的,是不同方向的探索

行业不应该只有一条路。当所有人都在追"超级 Agent + Skills"的时候,至少有人该想想"分工 + 矩阵"。

http://www.jsqmd.com/news/641837/

相关文章:

  • 中兴U30air与流量大师M3随身WiFi的ABD模式开启全攻略
  • 银河麒麟V10下grub2修复实战:从破坏到恢复的全过程
  • 数字传感护华为数字能源大厦,控制加固施工安全风险!
  • DeOldify云原生部署:基于Docker和Kubernetes构建弹性伸缩服务
  • MATLAB代码:基于Stackelberg博弈的光伏用户群优化定价模型 关键词
  • 4月14日成都地区柳钢产热轧卷(Q335B;厚度5.75-15.75mm)现货报价 - 四川盛世钢联营销中心
  • 11(十一)Jmeter设置全局变量
  • MongoDB GridFS的默认MD5计算在集群中消耗CPU怎么办
  • 多模态大模型幻觉防控的7个致命盲区(第4条90%团队仍在踩坑)
  • 从仿真到实践:3T4R毫米波雷达阵列信号建模与MVDR超分辨算法验证
  • Android 音视频编解码(三) -- MediaCodec 实战:同步与异步解码性能对比
  • Go语言的Docker容器化实践
  • RPG Maker Decrypter:新手也能轻松解密的游戏资源提取神器
  • 两级三相光伏并网仿真手札
  • Chrome浏览器下HackBar_v2.2.6插件的安装与破解指南
  • 手把手教你为STM32F407添加USB2.0高速支持(含PHY选型与ULPI接线详解)
  • 从POG到EPG:探索类脑计算系统层次结构的软件与硬件桥梁
  • 不同散热设计对HTML函数工具稳定性影响大吗_温控指南【指南】
  • 一次性看懂Lua热更新原理与演示
  • Hello Data:为物理AI采集“真物理”行为
  • 【词汇专栏】具身智能:当AI拥有身体
  • 异步电动机变频调速系统设计:仿真分析与文献综述,探讨两个仿真方案与技术应用
  • 2026届学术党必备的六大降AI率网站横评
  • 告别繁琐工作流:深度解析「椒图AI」如何用多模型聚合驱动高效图像创作
  • 汇川PLCeasy320轴控指令使用。使能、读位置、设置位置、相对位移、停止指令
  • 杭州中西医结合医院肿瘤科好不好
  • 四旋翼仿真模型:高精度非线性建模,支持ADRC与PID控制器灵活切换及纯姿态角控制模式
  • 4月14日成都地区攀钢产热轧卷(Q335B;厚度5.75-15.75mm)现货报价 - 四川盛世钢联营销中心
  • Windows下PostgreSQL 17便携版安装与权限配置全流程(含PSQL连接神坑详解)
  • 如何快速部署VideoSrt:面向初学者的完整实战指南