AI之技能Skill简介
Skill(技能) 本质上是:可被模型调用、可组合、可复用、可执行的能力单元(Capability Unit),连接:
- LLM 推理能力
- 外部世界执行能力
- 长期工作流能力
Skill 介绍
从“概率预测”到“确定性执行”: LLM 本质上是一个概率分布模型,擅长理解、生成、推理规划等,但不擅长执行精确的任务(API 调用、外部工具控制、状态管理、多步稳定执行等)。
生命周期执行时序逻辑
本质
Skill 本质是结构化能力封装,可看作:Skill = Prompt + Tool + Memory + Workflow + Constraints。
Skill 要解决以下核心问题:
| 问题 | 作用 |
|---|---|
| 能力复用 | 多 Agent 共用 |
| Tool 封装 | 隐藏复杂性 |
| 权限隔离 | 安全执行 |
| 可测试 | 单元测试 |
| 可观测 | Trace/Replay |
| 可编排 | Planner 调度 |
| 长期记忆 | 与 Memory 集成 |
| 环境隔离 | Sandbox |
| 可部署 | 独立运行 |
| 可版本化 | Skill Registry |
作用
Skill将离散的专业知识、组织规范和工作流程,转化为Agent可发现、可复用、可演进的工程资产能力包:
- 打破能力碎片化与上下文过载: 解决复杂任务中常面临,能力碎片化(需拼接多个独立模型或工具)、上下文丢失(长流程中记忆衰减)、执行不可控(推理与操作脱节,步骤易错、难回滚)。Skill通过渐进式披露机制,将技能信息分层按需加载:
- 元数据(约几十Token)预载:仅加载 Skill 名称、触发条件、输入输出 Schema,极低开销完成意图匹配与调度决策
- SKILL.md内容按需取用:仅在 Agent 判定需要此 Skill 时,才把详细的操作说明、规则判定树、参数示例等注入模型上下文
- 附加脚本仅在需要时执行:脚本(Python/Bash 等)不进入 LLM 上下文,仅在运行时由沙箱调用,执行返回值再回送给 Agent
- 打通专业领域知识的“最后一公里”: 通用大模型“知道但不会做”(本质是 陈述性知识(know-what)与程序性知识(know-how)的割裂),Skill 通过工程化封装:
- 可执行脚本:将反复验证的自动化逻辑(如数据清洗、API 编排、异常重试、权限校验)固化为确定性代码,不再依赖模型间接推理
- 操作指南:将特定场景下的决策顺序、条件分支、状态检查点与最终验收标准,以结构化文档(Markdown + 元数据)形式绑定给 Agent,使模型在生成每一步行动前都能
