当前位置: 首页 > news >正文

Agent Skills:让 Agent 具备真实世界能力

Agent Skills:让 Agent 具备真实世界能力

原文:Equipping agents for the real world with Agent Skills | Anthropic | 2025.10.16

导语

Claude 很强大,但完成真实世界的工作需要程序性知识和组织背景

比如,你公司的代码风格规范、特定的部署流程、行业特有的文档格式……这些知识不在 Claude 的训练数据里,也无法通过简单的提示词传递。

Agent Skills 是 Anthropic 提出的解决方案:用文件和文件夹将专业知识打包,让通用 Agent 变成符合你需求的专业化 Agent。


一、什么是 Skill

一个 Skill 就是一个包含 SKILL.md 文件的目录。就像给新员工写的入职指南,它包含有序的说明、脚本和资源,赋予 Agent 额外的能力。

SKILL.md 结构

---
name: PDF Form Filler
description: Fill PDF forms using Python scripts
---## Instructions1. Use the extract_fields.py script to get form fields
2. Fill in the fields based on user data
3. Save the completed PDF

二、渐进式披露机制

Skill 的核心设计是渐进式披露——不一次性把所有信息塞进上下文:

层级 加载时机 内容
第一级 启动时自动预加载 仅元数据(name、description)
第二级 Agent 认为相关时 完整的 SKILL.md 内容
第三级+ 特定场景下按需加载 捆绑的脚本、模板等额外文件

这种设计既保证了 Agent 知道有哪些能力可用,又避免了上下文窗口的浪费。


三、工作原理示例:PDF 编辑

Claude 擅长理解 PDF 内容,但无法直接操作 PDF(如填写表单字段)。通过 PDF Skill:

  1. Skill 包含一个 Python 脚本 extract_fields.py
  2. Claude 通过工具调用执行脚本,提取表单字段
  3. Claude 根据用户数据填充字段
  4. 脚本生成完成的 PDF

关键点: 代码通过工具调用执行,而不是加载到上下文窗口中,既高效又可靠。


四、开发最佳实践

1. 从评估开始

先识别 Agent 能力的差距,再构建 Skills 来填补。

2. 为规模化构建结构

当 SKILL.md 变得庞大时,拆分为单独的文件。代码既是可执行工具,也是文档。

3. 从 Claude 的角度思考

观察 Claude 在真实场景中如何使用 Skill。特别关注 Skill 的名称和描述——它们直接影响触发机制。

4. 与 Claude 一起迭代

让 Claude 将成功的策略和常见错误捕获到可复用的上下文和代码中。


五、安全考量

Skills 通过指令和代码为 Agent 提供新能力,但也可能引入风险:

  • 仅从受信任的来源安装 Skills
  • 对不受信任的来源,使用前需彻底审计
  • 特别检查代码依赖项和捆绑资源

六、未来展望

当前支持:Claude.ai、Claude Code、Claude Agent SDK、Claude Developer Platform。

未来方向:

  • 支持 Skill 的创建、编辑、发现、共享全生命周期
  • 探索 Skills 与 MCP 服务器的互补关系
  • 长远目标:让 Agent 能够自主创建、编辑和评估 Skills

读后感

Agent Skills 的理念很巧妙:不是让模型更聪明,而是给模型更好的"工作手册"。

这和现实世界的团队管理一模一样——最好的团队不一定由最聪明的人组成,而是由有清晰 SOP 和知识库的团队组成。


本文是 Anthropic AI Agent 系列 第 6 篇,共 15 篇。下一篇:上下文工程:Agent 的"记忆"与"注意力"管理

关注公众号 coft 获取系列更新。

http://www.jsqmd.com/news/395962/

相关文章:

  • 一文讲透|继续教育必备AI论文工具 —— 千笔写作工具
  • 2026年知名的自闭症特教设备/特教设备感统教室销售厂家推荐哪家好(真实参考) - 品牌宣传支持者
  • 上下文工程:Agent 的记忆与注意力管理
  • 2026年知名的弥散供氧分子筛制氧机/弥散供氧制氧系统哪家质量好厂家推荐(实用) - 品牌宣传支持者
  • 学术论文处理神器:YOLO X Layout自动识别章节与公式
  • Contextual Retrieval:让 RAG 更懂上下文
  • 【实时无功-有功控制器的动态性能】【带有电流控制的两级电压源变流器(VSC)】采用αβ阿尔法-贝塔转换进行电流反馈的实时无功功率控制器
  • 不用写代码也能编程:Qwen2.5-Coder-1.5B体验报告
  • 实测:去AIGC和率零哪个更适合你?选择指南
  • 大润发购物卡回收,闲置卡巧变现 - 京顺回收
  • 长时间运行的 Agent:如何设计可靠的执行框架
  • 综述不会写?千笔·专业学术智能体,继续教育写作标杆
  • 英文论文也能降AI率?海外留学生AIGC检测应对方案
  • AI开发-python-milvus向量数据库(2-8 -milvus-数据插入collection)
  • 盒马鲜生礼品卡可以回收吗?详细流程与重要注意事项 - 团团收购物卡回收
  • 2026年比较好的隔音泡棉/导电泡棉生产商推荐怎么选(可靠) - 品牌宣传支持者
  • 多 Agent 协作系统:Anthropic 的实战经验
  • SenseVoice Small部署教程:NVIDIA Container Toolkit集成配置指南
  • 2026年知名的职业生涯规划评估系统/职业生涯规划设备热门推荐 - 品牌宣传支持者
  • MCP 代码执行:构建更高效的 Agent
  • OFA图像语义蕴含模型部署教程:GPU利用率监控与batch size调优指南
  • ERNIE-4.5-0.3B-PT部署避坑:解决‘model not found’、‘out of memory’高频问题
  • 如何设计一个支持地理空间查询(Geo-spatial Query)的数据库索引?
  • 小白必看:Pi0机器人控制中心快速部署指南
  • 阿里开源图片旋转判断:快速解决图片角度问题
  • 2026年知名的柜内香氛五金/家用香氛五金工厂采购指南如何选(实用) - 品牌宣传支持者
  • Python 配置管理的哲学、范式与现代实践:超越 config.ini
  • 深度学习项目训练环境:一键安装与模型训练指南
  • MySQL性能优化:慢查询分析与SQL调优实战
  • 阿里小云KWS模型的多唤醒词识别技术实践