工作流程技能怎么写?从7个精品项目中提炼的模式与最佳实践
楔子
今天分享的这篇文章,在阿里巴巴和蚂蚁集团内部的技术分享平台 ATA 上,热度远超想象。
可见大家在工作中,想把自己的复杂工作流 / SOP(Standard Operation Procedure) 写成 Skill 时,总会遇到不知道怎么写,以及写完之后 Skill 运行不符合预期的情况。

在这篇文章中,青斧大佬分析了 7 个最顶尖的 Skill 案例,并根据分析结果总结了 5 种工作流 Skill 的设计模式。
经过了作者青斧的授权,在这里把文章分享给大家,希望大家在构建自己的工作流 Skill 时,也能够从中受到一些启发~
What's more?
大家其实可以让你的通用 Agent(例如 Claude Code)基于这篇文章的内容,快速 Vibe 出一个 SOP 智能分析工具,根据 SOP 文档,选择最适合的 Skill 模式生成对应 Skill。

同时进行沙盘效果评测,一步到位~

欢迎大家关注 OceanBase 社区公众号 “老纪的技术唠嗑局”,在这里,我们会持续为大家更新与 #AI 和 #Data 相关的技术内容~
话不多说,正文开始。
本文基于对 7 个来自 OpenAI、Google Labs、obra、Trail of Bits、Dean Peters 等团队的生产级 Skill 的逐行分析,提炼出的可复用的五种 Skill 设计模式、写作技巧和反面教训。
一、Skill 是什么
大家对 Skill 基本都有所了解,这里只言简意赅地提两句。
Skill 是一个文件夹,核心是 SKILL.md 文件,使用 YAML frontmatter + Markdown 正文 的格式。当 LLM 判断需要某个 Skill 时,会调用 skill 工具加载它,SKILL.md 的全部内容会作为 tool-result 注入到对话上下文中,LLM 读到后自主决定怎么执行。
my-skill/
├── SKILL.md # 主文件(必须)
├── scripts/ # 可执行脚本(可选)
├── references/ # 详细参考文档(可选,按需加载)
├── resources/ # 模板、清单等资源(可选)
└── examples/ # 示例(可选)
关键机制 :Skill 本质是"知识注入"——它不会动态生成新工具,而是把指令文本注入到 LLM 的上下文中,LLM 用已有的工具(bash、read、edit 等)来执行这些指令。

Skill 文件结构
二、Frontmatter:决定 Skill 是否被加载的"门面"
2.1 必填字段
| 字段 | 作用 | 示例 |
|---|---|---|
name |
唯一标识符,小写连字符 | test-driven-development |
description |
最关键——LLM 通过它决定是否加载 | 见下方对比 |
2.2 Description 的写法决定加载率
# 好的 description — 包含触发短语和关键词
description:DeployapplicationsandwebsitestoVercel.Usewhentheuser
requestsdeploymentactionslike"deploy my app","push this live",
or"create a preview deployment".# 好的 description — 定义时序位置
description:Usewhenimplementinganyfeatureorbugfix,beforewriting
implementationcode# 差的 description — 太模糊
description:Helpswithdeploymentstuff
核心原则 :
- 列举触发短语 :把用户可能说的话写进去("deploy my app"、"push this live")
- 定义时序位置 :说明"在什么之前/之后"使用("before writing implementation code")
- 包含产品关键词 :如果覆盖大平台,把所有产品名列出来
2.3 可选扩展字段
从 7 个 Skill 中观察到的扩展字段:
| 字段 | 来源 | 作用 |
|---|---|---|
references |
OpenCode cloudflare | 声明最重要的参考文档 |
allowed-tools |
Google Labs stitch-loop | 声明需要的工具权限 |
type |
Dean Peters discovery-process | 声明 Skill 类型(workflow/component) |
best_for |
Dean Peters discovery-process | 最适合的场景列表 |
scenarios |
Dean Peters discovery-process | 具体的触发场景示例 |
estimated_time |
Dean Peters discovery-process | 预估执行时间 |
三、5 种核心设计模式

5 种核心设计模式
模式 1:线性流程
适用场景 :部署、安装、迁移等有明确步骤的操作。
代表 :openai/skills — vercel-deploy [1] (77 行)
结构 :
# 标题
## Prerequisites(前置条件)
## Quick Start(主流程:Step 1 → 2 → 3)
## Fallback(降级方案)
## Troubleshooting(故障排除)
关键技巧 :
| 技巧 | 示例 | 为什么有效 |
|---|---|---|
| 安全默认值 | "Always deploy as preview, not production" | 防止 LLM 做出危险操作 |
| 具体命令 | 每步给出可直接执行的 bash 命令 | LLM 不需要猜测 |
| 超时提示 | "Use a 10 minute (600000ms) timeout" | 防止 LLM 因超时中断 |
| 降级方案 | CLI 失败有 Fallback 脚本 | 提供 B 计划 |
| 负面指令 | "Do not curl the deployed URL to verify" | 明确禁止不该做的事 |
适用判断 :如果你的 Skill 可以用"先做 A,再做 B,最后做 C"描述,就用线性模式。

线性流程模式
模式 2:决策树 + 按需加载
适用场景 :大型平台选型、产品导航、问题诊断。
代表 :openai/skills — cloudflare-deploy [2] (224 行)
结构 :
# 标题
## Authentication(认证前置)
## Quick Decision Trees(决策树)
### "I need to run code"(按用户意图分类)
### "I need to store data"
### "I need AI/ML"
## Product Index(产品索引表)
关键技巧 :
| 技巧 | 示例 | 为什么有效 |
|---|---|---|
| 用户意图分类 | "I need to run code" 而非 "Compute products" | 用用户语言而非技术术语 |
| 树形导航 | ├─ 边缘无服务器函数 → workers/ |
LLM 快速定位正确产品 |
| 渐进式披露 | 主文件 7KB,references/ 按需展开到几十万字 | 不浪费上下文窗口 |
| 产品索引表 | Product → Reference 的映射表 | 结构化的快速查找 |
适用判断 :如果你的 Skill 覆盖的知识域有 10+ 个分支,且每个分支都有大量详细文档,就用决策树模式。

决策树模式
进阶 :同一个知识域可以拆成两个 Skill——
- 导航型(cloudflare):只做选型,不涉及操作
- 操作型(cloudflare-deploy):包含认证、命令、故障排除
模式 3:循环迭代
适用场景 :TDD、代码审查、设计评审等需要反复执行的流程。
代表 :obra/superpowers — test-driven-development [3] (371 行)
结构 :
# 标题
## The Iron Law(铁律——不可违反的核心原则)
## Red-Green-Refactor(循环体)
### RED — 写失败的测试
### Verify RED — 验证确实失败
### GREEN — 写最少的代码
### Verify GREEN — 验证确实通过
### REFACTOR — 清理
### Repeat(回到 RED)
## Common Rationalizations(借口反驳表)
## Verification Checklist(退出条件)
关键技巧 :
| 技巧 | 示例 | 为什么有效 |
|---|---|---|
| 强硬语气 | "Delete it. Start over." | LLM 倾向于"灵活变通",强硬语气提高遵从率 |
| Good/Bad 对比 | 用 和 标签包裹代码示例 |
对比教学效果最好 |
| 借口反驳表 | 预判 LLM 可能的 12 种偷懒借口并逐一反驳 | 堵死所有逃避路径 |
| 验证清单 | 8 项 checklist 作为循环退出条件 | 确保质量达标才能结束 |
| 人类兜底 | "ask your human partner" | 不确定时交给人 |
适用判断 :如果你的 Skill 需要 LLM 反复执行"做 → 验证 → 改进"的循环,就用迭代模式。

循环迭代模式
模式 4:接力棒循环(跨 Session 持久化)
适用场景 :多次迭代的长期项目,需要跨多个 session 持续工作。
代表 :google-labs-code/stitch-skills — stitch-loop [4] (203 行)
结构 :
# 标题
## Overview(接力棒模式概述)
## The Baton System(接力棒文件规范)
## Execution Protocol(6 步执行协议)
### Step 1: Read the Baton(读接力棒)
### Step 2: Consult Context Files(查阅上下文)
### Step 3: Generate(执行任务)
### Step 4: Integrate(集成结果)
### Step 5: Update Documentation(更新文档)
### Step 6: Prepare the Next Baton ⚠️(写下一个接力棒——关键!)
## File Structure Reference(文件协议)
## Orchestration Options(编排方式)
关键技巧 :
| 技巧 | 示例 | 为什么有效 |
|---|---|---|
| 文件即状态 | next-prompt.md 作为接力棒 |
LLM 不需要记住"上次做到哪了" |
| 续命机制 | Step 6 标记为 Critical + MUST | 忘了写接力棒循环就断了 |
| 文件协议 | 每个文件有明确职责 | LLM 只需按协议读写文件 |
| 编排无关 | CI/CD、人在回路、Agent 链都能驱动 | 同一个 Skill 适配多种自动化环境 |
适用判断 :如果你的 Skill 需要跨多个 session 持续工作,或者需要多个 Agent 协作,就用接力棒模式。

接力棒循环模式
与模式 3 的区别 :
| 维度 | 循环迭代(TDD) | 接力棒循环(Stitch Loop) |
|---|---|---|
| 状态存储 | LLM 对话上下文 | 外部文件系统 |
| 跨 session | ❌ | ✅ |
| 循环退出 | Checklist 全部打勾 | 路线图清空 |
| 适用时长 | 单次会话(分钟~小时) | 长期项目(天~周) |
模式 5:多阶段 + 检查点 + Skill 编排
适用场景 :复杂的多周流程,需要在关键节点做 Go/No-Go 决策。
代表 :deanpeters/Product-Manager-Skills — discovery-process [5] (502 行)
结构 :
# 标题
## Key Concepts(核心概念 + 反模式)
## Phase 1: Frame the Problem(阶段 1)
### Activities(调用哪些子 Skill)
### Outputs(阶段产出)
### Decision Point 1(检查点:YES/NO + 时间影响)
## Phase 2-6...(重复相同结构)
## Complete Workflow(端到端时间线)
## Common Pitfalls(常见陷阱)
## References(引用的子 Skill 列表)
关键技巧 :
| 技巧 | 示例 | 为什么有效 |
|---|---|---|
| 统一阶段模板 | 每个 Phase 都有 Activities → Outputs → Decision Point | LLM 快速理解结构 |
| 决策检查点 | "达到饱和了吗?YES → 下一阶段,NO → +1 周" | 防止盲目推进 |
| Skill 编排 | 调度 10+ 个子 Skill 完成各阶段 | 编排器模式,大 Skill 调度小 Skill |
| 时间影响 | 每个 NO 路径标注"+2-3 days"、"+1 week" | 让用户了解延迟成本 |
| 交互协议分离 | 引用 workshop-facilitation 定义交互方式 |
关注点分离 |
适用判断 :如果你的 Skill 跨越多天/多周,有明确的阶段划分和 Go/No-Go 决策点,就用多阶段模式。

多阶段检查点模式
特殊模式:思维框架(控制 LLM "怎么想")
适用场景 :安全审计、代码审查、架构分析等需要深度思考的场景。
代表 :trailofbits/skills — audit-context-building [6] (302 行)
结构 :
# 标题
## Purpose(定位:控制思维方式,不是控制行为)
## When to Use / When NOT to Use
## Rationalizations(借口反驳表)
## Phase 1: Initial Orientation(定向扫描)
## Phase 2: Ultra-Granular Function Analysis(逐行分析——核心)
### Per-Function Checklist(函数微分析清单)
### Cross-Function Flow Analysis(跨函数追踪)
### Output Requirements(输出格式 + 量化阈值)
### Completeness Checklist(完整性检查)
## Phase 3: Global System Understanding(全局理解)
## Stability Rules(反幻觉规则)
## Non-Goals(明确禁止做的事)
关键技巧 :
| 技巧 | 示例 | 为什么有效 |
|---|---|---|
| 思维工具 | 第一性原理、5 Why、5 How | 给 LLM 分析框架而非具体命令 |
| 量化阈值 | "每个函数最少 3 个不变量、5 个假设" | 强制 LLM 达到足够的分析深度 |
| 非目标约束 | "不要识别漏洞、不要提出修复" | 克制 LLM 最想做的事,先理解再判断 |
| 反幻觉规则 | "Never reshape evidence to fit earlier assumptions" | 防止 LLM 自我欺骗 |
| 子 Agent 指导 | 何时以及如何使用 function-analyzer Agent | 分而治之 |
适用判断 :如果你的 Skill 需要 LLM 进行深度分析而非快速执行,需要控制的是"思维质量"而非"操作步骤",就用思维框架模式。
四、通用写作技巧
4.1 防止 LLM 偷懒的 4 种武器

防止 LLM 偷懒的 4 种武器
| 武器 | 原理 | 示例来源 |
|---|---|---|
| 强硬语气 | LLM 对命令式语气的遵从率更高 | TDD:"Delete it. Start over." |
| 借口反驳表 | 预判 LLM 的自我合理化路径并堵死 | TDD:12 种借口 + 反驳;审计:6 种借口 |
| 量化阈值 | 给出硬性的最低标准 | 审计:"最少 3 个不变量、5 个假设" |
| 负面指令 | 明确说"不要做 X" | vercel-deploy:"Do not curl the URL" |
4.2 教学的 3 种有效方式
| 方式 | 原理 | 示例来源 |
|---|---|---|
| Good/Bad 对比 | 对比学习效果最好 | TDD:vs 代码示例 |
| 具体命令 | LLM 擅长执行具体指令 | vercel-deploy:每步都有 bash 命令 |
| 完整示例 | 展示期望的输出格式 | 审计:引用 FUNCTION_MICRO_ANALYSIS_EXAMPLE.md |
4.3 安全与边界的 3 条原则
| 原则 | 做法 | 示例来源 |
|---|---|---|
| 安全默认值 | 默认选择最安全的选项 | vercel-deploy:"Always deploy as preview" |
| 权限最小化 | 只在必要时提升权限 | vercel-deploy:"Do not escalate the installation check" |
| 人类兜底 | 不确定时交给人 | TDD:"ask your human partner" |
4.4 知识组织的 3 层架构

知识组织 3 层架构
- 第 1 层:Frontmatter (~100 tokens)→ LLM 扫描所有 Skill 的 description,决定是否加载
- 第 2 层:SKILL.md 正文 (<5K tokens)→ 核心指令、决策树、流程步骤
- 第 3 层:references/ 和 resources/ (按需加载)→ 详细文档、示例、清单,LLM 用 read 工具按需读取
Token 预算参考 :
| 层级 | Token 预算 | 内容 |
|---|---|---|
| Frontmatter | ~100 tokens | name + description |
| 主文件 | 2K-5K tokens | 核心指令 |
| 参考文档(单个) | 1K-3K tokens | 按需加载 |
| 总上下文占用 | <10K tokens | 主文件 + 1-2 个参考文档 |
五、模式选择决策树

模式选择决策树
你的 Skill 需要做什么?
│
├─ 执行一个有明确步骤的操作
│ └─ → 模式 1:线性流程
│
├─ 在大量选项中帮用户选择正确的方向
│ └─ → 模式 2:决策树 + 按需加载
│
├─ 在单次会话中反复执行"做→验证→改进"
│ └─ → 模式 3:循环迭代
│
├─ 跨多个 session 持续推进一个长期项目
│ └─ → 模式 4:接力棒循环
│
├─ 跨越多天/多周,有阶段划分和 Go/No-Go 决策
│ └─ → 模式 5:多阶段 + 检查点
│
└─ 需要 LLM 进行深度分析而非快速执行└─ → 特殊模式:思维框架
六、快速上手模板
最小可用 Skill(线性模式)
---
name:my-skill
description:[一句话描述做什么+什么时候触发]
---# Skill 名称[一句话核心原则+安全默认值]## Prerequisites-[前置条件1]
-[前置条件2]## Steps### Step 1: [动作]\`\`\`bash
[具体命令]
Step 2: [动作]
[具体指令]
Step 3: [动作]
[具体指令]
Troubleshooting
| Issue | Solution |
|---|---|
| [问题 1] | [解决方案] |
### 循环迭代 Skill 模板\`\`\`yaml
---
name: my-loop-skill
description: [描述 + 触发时机]
---# Skill 名称## Core Principle[不可违反的铁律]## The Loop### Phase A — [动作][具体指令]### Verify A[验证命令]### Phase B — [动作][具体指令]### Verify B[验证命令]### Repeat回到 Phase A。## Rationalizations| Excuse | Reality |
|--------|---------|
| "[借口 1]" | [反驳] |## Completion Checklist- [ ] [条件 1]
- [ ] [条件 2]
七、参考资源
官方规范
- Agent Skills 开放标准 [7]
- anthropics/skills — 官方模板 [8]
- anthropics/skills — 规范文档 [9]
精选仓库
- openai/skills [10] — OpenAI Codex 官方 Skill 目录
- obra/superpowers [11] — 14 个工作流型 Skill
- google-labs-code/stitch-skills [12] — 设计到代码的 Skill
- deanpeters/Product-Manager-Skills [13] — 40+ 产品管理 Skill
- trailofbits/skills [14] — 安全审计 Skill
- openclaw/clawhub [15] — Skill 注册中心
精选列表
- VoltAgent/awesome-agent-skills [16] — 500+ Skill 索引
- travisvn/awesome-claude-skills [17] — 精选列表 + Skill vs MCP 对比
八、本文分析的 7 个 Skill 速查表
| # | Skill | 来源 | 模式 | 行数 | 一句话精髓 |
|---|---|---|---|---|---|
| 1 | vercel-deploy |
OpenAI | 线性 | 77 | 最小但完整的 Skill 模板 |
| 2 | cloudflare-deploy |
OpenAI | 线性 + 决策树 | 224 | 大平台的渐进式披露 |
| 3 | cloudflare |
OpenCode | 纯决策树 | 211 | 导航型 vs 操作型的区别 |
| 4 | test-driven-development |
obra | 循环迭代 | 371 | 堵死 LLM 偷懒的所有退路 |
| 5 | stitch-loop |
Google Labs | 接力棒循环 | 203 | 文件即状态,跨 session 持久化 |
| 6 | discovery-process |
Dean Peters | 多阶段 + 检查点 | 502 | 编排器模式,调度 10+ 子 Skill |
| 7 | audit-context-building |
Trail of Bits | 思维框架 | 302 | 控制 LLM "怎么想"而非"做什么" |

参考资料
[1]
openai/skills — vercel-deploy: https://github.com/openai/skills/tree/main/skills/.curated/vercel-deploy
[2]
openai/skills — cloudflare-deploy: https://github.com/openai/skills/tree/main/skills/.curated/cloudflare-deploy
[3]
obra/superpowers — test-driven-development: https://github.com/obra/superpowers/tree/main/skills/test-driven-development
[4]
google-labs-code/stitch-skills — stitch-loop: https://github.com/google-labs-code/stitch-skills/tree/main/skills/stitch-loop
[5]
deanpeters/Product-Manager-Skills — discovery-process: https://github.com/deanpeters/Product-Manager-Skills/tree/main/skills/discovery-process
[6]
trailofbits/skills — audit-context-building: https://github.com/trailofbits/skills/tree/main/plugins/audit-context-building/skills/audit-context-building
[7]
Agent Skills 开放标准: https://agentskills.io/
[8]
anthropics/skills — 官方模板: https://github.com/anthropics/skills/tree/main/template
[9]
anthropics/skills — 规范文档: https://github.com/anthropics/skills/tree/main/spec
[10]
openai/skills: https://github.com/openai/skills
[11]
obra/superpowers: https://github.com/obra/superpowers
[12]
google-labs-code/stitch-skills: https://github.com/google-labs-code/stitch-skills
[13]
deanpeters/Product-Manager-Skills: https://github.com/deanpeters/Product-Manager-Skills
[14]
trailofbits/skills: https://github.com/trailofbits/skills
[15]
openclaw/clawhub: https://github.com/openclaw/clawhub
[16]
VoltAgent/awesome-agent-skills: https://github.com/VoltAgent/awesome-agent-skills
[17]
travisvn/awesome-claude-skills: https://github.com/travisvn/awesome-claude-skills
往期内容推荐

AI 技术 · 目录
作者提示: 个人观点,仅供参考
阅读原文
