当前位置：首页 > news >正文

AI之技能Skill简介

news 2026/7/9 1:25:43

Skill（技能）本质上是：可被模型调用、可组合、可复用、可执行的能力单元（Capability Unit），连接：

从“概率预测”到“确定性执行”： LLM 本质上是一个概率分布模型，擅长理解、生成、推理规划等，但不擅长执行精确的任务（API 调用、外部工具控制、状态管理、多步稳定执行等）。

生命周期执行时序逻辑

Skill 本质是结构化能力封装，可看作：Skill = Prompt + Tool + Memory + Workflow + Constraints。

Skill 要解决以下核心问题：

Skill将离散的专业知识、组织规范和工作流程，转化为Agent可发现、可复用、可演进的工程资产能力包：

打破能力碎片化与上下文过载：解决复杂任务中常面临，能力碎片化（需拼接多个独立模型或工具）、上下文丢失（长流程中记忆衰减）、执行不可控（推理与操作脱节，步骤易错、难回滚）。Skill通过渐进式披露机制，将技能信息分层按需加载：
- 元数据（约几十Token）预载：仅加载 Skill 名称、触发条件、输入输出 Schema，极低开销完成意图匹配与调度决策
- SKILL.md内容按需取用：仅在 Agent 判定需要此 Skill 时，才把详细的操作说明、规则判定树、参数示例等注入模型上下文
- 附加脚本仅在需要时执行：脚本（Python/Bash 等）不进入 LLM 上下文，仅在运行时由沙箱调用，执行返回值再回送给 Agent
打通专业领域知识的“最后一公里”：通用大模型“知道但不会做”（本质是陈述性知识（know-what）与程序性知识（know-how）的割裂），Skill 通过工程化封装：
- 可执行脚本：将反复验证的自动化逻辑（如数据清洗、API 编排、异常重试、权限校验）固化为确定性代码，不再依赖模型间接推理
- 操作指南：将特定场景下的决策顺序、条件分支、状态检查点与最终验收标准，以结构化文档（Markdown + 元数据）形式绑定给 Agent，使模型在生成每一步行动前都能