当前位置: 首页 > news >正文

Claude Skills | 新一代AI Agent 必备标准,让你效率起飞的技能包

关注我的公众号,获取独家信息和资料

一、Claude Skills 是什么?

Claude code 官方文档给出了 Agent Skills 的定义:

智能体技能(Agent Skills)是一种用于扩展 Claude 的功能的模块化的能力。每个“技能”都封装了相应的指令、元数据和可选资源(例如脚本、模板)。当场景匹配时,Claude 会自动调用这些技能来完成任务。

Skills 的三大组成要素:

  • 元数据:Skill 的名称、描述、标签等信息;

  • 指令:Skill 具体的指令;

  • 资源:Skill 附带的相关资源(比如文件、可执行代码等);

Anthropic 在 GitHub 上开源了一系列的 Agent Skills:https://github.com/anthropics/skills/tree/main/skills

以画布设计的 Skill 为例,一个 Skill 就是一个文件夹,可以包含嵌套的子文件夹,形成 Skills 的嵌套层级。

上面的三要素对应:

  • 元数据:包含在SKILL.md的 YAML 头中;

  • 指令:SKILL.md的内容;

  • 资源:Skill 文件夹中的其他文件(比如下图中的 canvas-font 文件夹包含了设计画布时可以使用的字体),资源可以在指令中被引用;

了解 Skills 结构:每个 Skills 包含以下结构

my-skills/ ├── skills.md (必需) │ │ │ ├── YAML Frontmatter (元数据区,必需) │ │ ├── name: (技能名称,必需) │ │ └── description: (技能描述,必需) │ │ │ └── Markdown 指令 (SOP指令区,必需) │ └── 捆绑资源 (可选) ├── scripts/ - 存放可执行代码 (如 Python, Bash 脚本) ├── references/ - 存放供AI参考的文档 (如 API文档, 知识库) └── assets/ - 存放技能可能用到的静态资源 (如 模板文件, 图标, 字体)

二、Claude Skills 的工作机制?

Claude Skills 的设计遵循了一个非常重要的原则:

Progressive Disclosure - 渐进式批露:

按需分阶段加载信息,而不是在任务开始时就将所有内容全部塞入本就宝贵的上下文窗口中。

1 . 三个加载级别

整个加载过程分为三个级别,对应上面的三要素,每种在不同时间加载:

第 1 级:元数据(始终加载)

每个 Skill 都有一个SKILL.md文件,头部的 YAML 前置数据提供发现信息,包含了名称和描述。

--- name: pdf-processing description: 从 PDF 文件中提取文本和表格、填充表单、合并文档。在处理 PDF 文件或用户提及 PDF、表单或文档提取时使用。 ---

Claude 在启动时加载此元数据并始终保持在上下文窗口中。这种轻量级方法意味着我们可以安装许多 Skills 而不会产生上下文成本(每个 Skill 约占 100 个令牌);Claude 只知道每个 Skill 的存在以及何时使用它

第 2 级:核心指令(触发时加载)

当 Claude 发现某个 Skill 与当前任务相关时,Claude 会使用 bash 命令阅读**SKILL.md**文件的主体内容,例如:

# PDF 处理 ## 快速入门 使用 pdfplumber 从 PDF 中提取文本: ```python import pdfplumber with pdfplumber.open("document.pdf") as pdf: text = pdf.pages[0].extract_text() 有关高级表单填充,请参阅 [FORMS.md](FORMS.md)。

只有在这个时候,Skill 的核心指令和工作流程才会进入上下文窗口。Claude 开始学习如何完成这项具体任务。

第 3 级:资源和代码(按需加载)

一个复杂的 Skill 可Claude 会根据能包含多个文件,形成一个完整的知识库。

pdf-skill/ ├── SKILL.md (主要指令) ├── FORMS.md (表单填充指南) ├── REFERENCE.md (详细 API 参考) └── scripts/ └── fill_form.py (实用脚本)

Claude 会根据 SKILL.md 中的指引,在需要时才去读取 FORMS.md 或执行 fill_form.py 脚本。

脚本代码本身永远不会进入上下文窗口,不消耗上下文,只有脚本的输出结果会作为反馈进入上下文。

Skills 架构

Skills 在代码执行环境中运行,Claude 具有文件系统访问、bash 命令和代码执行功能。可以这样想:Skills 作为虚拟机上的目录存在,Claude 使用 bash 命令与它们交互。

示例:Claude 如何加载和使用 PDF 处理 skill

以下是 Claude 如何加载和使用 PDF 处理 skill 的方式:

  1. 启动:系统提示包括:PDF 处理 - 从 PDF 文件中提取文本和表格、填充表单、合并文档

  2. 用户请求:「提取这份PDF的文本并总结」

  3. Claude 调用bash: read pdf-skill/SKILL.md` → 指令加载到上下文中

  4. Claude 确定:不需要表单填充,因此不读取 FORMS.md

  5. Claude执行:使用 SKILL.md 中的指令完成任务

下图说明了渐进式披露的信息加载过程:

三、Claude Skills 和 MCP 的区别是什么?

Claude Skills是一种基于文件系统的、可复用的知识包,运行在 Claude 的沙盒虚拟机(VM)环境中,用于向 Agent 注入流程化、确定性的内部知识(SOP)的标准化方案。

MCP是一种开放 AI 工具的标准,允许任何外部服务(无论是 Jira、Stripe 还是内部 API)将自己的能力以一种标准化的方式暴露给 Agent,让 Agent 可以不关心工具注册、工具发现、工具调用等工程实现细节。

Claude Skills 和 MCP 是可以协同工作的,Claude Skills 为 Agent 提供可复用知识包、MCP 为 Agent 提供外部工具。

四、Skills 解决了哪些实际问题

封装专业知识,解决「专业问题」

将特定领域的最佳实践和操作流程封装成可复用的技能,高效完成特定任务

扩展AI能力边界,组合skills解决「能力问题」

让 AI 能处理更专业、更复杂的任务及更多能力边界的事情,多个 skills 可组成协同工作,持续进行学习优化,例如很多大模型无法直接处理和生成 PPT

上下文窗口的「成本问题」

以前,一个复杂任务的指令往往要塞进上下文。现在,通过分级加载,Claude skills 可以节省大量 token 成本,在复杂任务中可降低 40%-60% 的上下文占用。

知识的「可复用性」

skills 文件可一次创建、共享、复用、更新,团队成员可以共用同一技能库。这让「隐性经验」第一次可以以结构化形式沉淀下来。

提供SOP标准作业程序) 工作流模板,执行的「确定性」

skills 可以调用脚本完成具体操作,把任务处理流程(SOP)逻辑写清楚、标准化,减少「理解偏差」。这让模型的执行更可靠,也更容易追踪,工作效率得以大幅提升。

Agent Skills 很可能会在短时间内成为工业级 Agent 标配的能力

五、快速上手使用官方skills

自 10 月份 Anthropic 发布 Agent Skills 后,CodeBuddy 作为国内首家产品适配了 Skills

配置 skills 目录, 克隆 skills 仓库

#在CodeBuddy IDE 中进行配置 skills 目录, 克隆 skills 仓库,打开项目目录 mkdir - p ~/.codebuddy cd ~/.codebuddy git clone https://github.com/anthropics/skills.git

检测 Skills 是否生成

在 CodeBuddy 对话框中输入list skills 进行检测是否生效

执行 Prompt

  • 进行skills应用,在CodeBuddy 对话框中直接使用输入以下 Prompt

使用 webapp-testing skills 帮我针对 https://codebuddy.ai 官网做下 web 应用测试

六、使用 CodeBuddy 自定义一个代码审查 Skills

创建

使用 CodeBuddy 创建一个代码审查 Skills 示例,可以在此基础上加上团队的代码规范让优化 Skills

使用

http://www.jsqmd.com/news/109943/

相关文章:

  • 上海样册设计指南,如何让企业样册脱颖而出
  • 开发者必看:Kotaemon最佳实践中的10个避坑建议
  • Cursor快捷键大全:效率翻倍的隐藏技巧
  • 政务热线智能化:Kotaemon实现政策文件精准引用
  • SpringBoot+Vue html 图书管理系统管理平台源码【适合毕设/课设/学习】Java+MySQL
  • 高效RAG系统搭建指南:以Kotaemon为例的技术路径
  • FFT 工程关键点总结(采样分辨率 / 频点 / 相位)
  • AI应用架构师视角:企业数据中心合作伙伴的选择策略
  • 不止于 Dify:为什么我在部署私有 LLM 时选择了它?
  • 内网穿透工具新选择:这款免费工具如何让远程访问变得简单高效
  • 上海样册设计指南,打造触动人心的视觉叙事
  • QCoreApplication::aboutToQuit
  • KotaemonLeetCode刷题伴侣:思路提示与优化建议
  • 基于python的搜索引擎设计与实现(源码+文档)
  • Kotaemon能否用于在线教育答疑?学生反馈积极
  • Kotaemon能否用于招投标文件比对?商务应用探索
  • EmotiVoice语音合成在艺术装置中的声音叙事设计
  • Qt跨线程安全通信指南
  • 【AI平台核心架构设计】
  • Kotaemon诗歌生成实验:古典诗词风格模仿
  • 基于SpringBoot+Vue的航班进出港管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】
  • QObject::startTimer: Timers can only be used with threads started with QThread
  • Kotaemon社区活跃度调查:GitHub星标增长趋势分析
  • Kotaemon支持LDAP目录服务集成吗?组织架构同步
  • 向量数据库常用SQL语句
  • 47、深入了解 NNTP 协议及其应用
  • Kotaemon与LangChain对比:谁更适合生产环境?
  • Kotaemon能否用于图书馆检索?公共文化服务创新
  • 批量将 Word 文档重命名为其标题
  • 我发现动态病例生成补足医学教育短板,三甲医院培训效率翻倍