当前位置: 首页 > news >正文

agent skill实战:结构设计 + 故障排查实战

前言

本文将使用一个例子“线上故障排查”,结合该例子,来详细讨论一下skill在实战中的应用

skill的组成

.
├── SKILL.md
├── references/
├── examples/
└── scripts/
  • SKILL.md:主入口文件

    • 这个 Skill 是干什么的
    • 什么时候触发
    • 先读哪些参考资料
    • 按什么顺序执行
    • 输出结构是什么
    • 哪些行为必须避免
  • references/:参考资料目录

    • 规则和资料分离,维护更清楚
    • 主文件不至于写成一坨
    • 后面更新局部知识时,不用频繁改主 Skill
  • examples/:示例目录,这个目录里通常放两类东西:

    • 标准输入示例
    • 标准输出示例
  • scripts/:脚本目录

skill实践

下面我们来说一个,线上故障排查的例子

.
├── SKILL.md
├── references/
│   ├── triage-playbook.md
│   ├── metrics-checklist.md
│   └── output-template.md
├── examples/
│   ├── alert-input.json
│   └── expected-analysis.md
└── scripts/
文件 示例路径 作用
主 skill 文件 SKILL.md 定义触发条件、执行流程、边界、输出要求
排障手册 references/triage-playbook.md 存放排障原则、先后顺序、常见排查思路
指标检查清单 references/metrics-checklist.md 规定看哪些指标、哪些现象该重点关注
输出模板 references/output-template.md 统一分析结果结构,避免每次输出漂移
输入样例 examples/alert-input.json 给这个 skill 一个标准化输入示例
输出样例 examples/expected-analysis.md 演示符合预期的排障分析结果

代码路径: skill实践

使用方式

  • 使用claude code作为载体来使用skill,先将该项目移动到~/.claude/skills/下面

  • 登陆claude code开始使用

    watermarked-1

  • 得到结果

    watermarked-2

当使用标准的输入数据

{"service": "order-service","env": "prod","time_window": "2026-04-24 14:05 ~ 14:12","alert_title": "订单服务 5xx 错误率升高","symptom": "/api/order/create 接口错误率从 0.3% 升到 18%","logs": ["2026-04-24T14:06:13 ERROR order-service create order failed: dial tcp 10.21.4.15:3306: i/o timeout","2026-04-24T14:06:14 ERROR order-service query inventory failed: dial tcp 10.21.4.15:3306: i/o timeout"],"metrics": {"5xx_rate": "0.3% -> 18%","p95_latency": "120ms -> 4.8s","db_connection_timeout": "持续升高","cpu": "无明显异常","memory": "无明显异常"}
}

skill返回的答案通常是非常完整的,但是如果不给它这么全的数据的时候,结果会怎样?

提供非标数据

本次不用标准数据,而是非常笼统的数据咨询,看看得到的结果是什么

order-service出现了问题,订单服务 5xx 错误率升高,日志:2026-04-24T14:06:13 ERROR order-service create order failed: dial tcp 10.21.4.15:3306: i/o timeout

watermarked-3

成功使用对应skill,开始分析

watermarked-4

证据链太少,并不能分析出根因以及对应的解决方案,如果还需要继续排查,就要不断的提供对应的数据

添加数据查询工具

  • 为了让skill在排查的过程中,能够获取到新的数据,在/scripts下添加一个查询工具:获取mysql的状态get_mysql_state

  • 先告诉skill有工具可以调用,在SKILL.md中添加新的参考资料 references/tools.md

  • references/tools.md添加脚本使用方式

再来看看效果:

watermarked-5

skill启动之时,读取了参考资料,并且获取了mysql是否通畅的证据

function call 与 skill

skill的简单使用已经介绍完毕了,下面来对比一下function call与skill,这俩之间在什么场景下去使用

与之前介绍过的function call :

  • function call 实战:让 LLM 自动判断 pod 异常、调用日志工具并完成故障分析
  • 别再写 if/else 了:让 LLM 自己决定调用哪个函数

进行对比:

function call skill
定位 function call更合适出现在底层工具的建设中 skill是ai agent的强力助手
环境依赖 不依赖 Claude Code、openclaw 环境,可作为独立服务部署 需要claude code、openclaw等环境,不能独立存在
优化策略 需要不断修改代码来进行不断优化(不管是流程代码,还是prompt)更像是传统开发流程 通过更新 references 下的 markdown 文档即可优化策略,当然也会有script的优化
最佳场景 自动化、集成到现有系统 ai agent的优秀辅助、结构化分析问题
共同协作 skill 调用 function call 作为工具 function call 参考 Skill 的流程规范

总结

本文介绍了skill的基本自称以及用了一个实际例子作为案例剖析展现了如何使用skill

再次对比了function call与skill,在各自对应的环境起到的作用

联系我

  • 联系我,做深入的交流

至此,本文结束

在下才疏学浅,有撒汤漏水的,请各位不吝赐教...

http://www.jsqmd.com/news/718646/

相关文章:

  • 怎样高效构建微信智能助手:完整实用手册
  • RTX 4090专属优化:yz-bijini-cosplay镜像性能与画质全解析
  • 零基础也能玩转3D!Deep3D让普通视频秒变立体大片
  • 面向高可靠与快速响应需求的高端报警系统功率MOSFET选型策略与器件适配手册
  • 从“定比分点”到“交比不变”:用初中三角形面积公式,轻松理解射影几何的核心定理
  • 马斯克五步法实战:用Notion和飞书搭建你的个人效率系统(附模板)
  • 如何快速配置Boss-Key:Windows隐私保护的终极指南
  • AI剧本杀对局全流程界面设计报告
  • 2026年知网AIGC检测升级后80%标红?必看三招自救指南,最后一招太香了! - 降AI实验室
  • Windows 10系统精简终极指南:如何用开源工具让你的电脑快如闪电?
  • 【nanobot】 实战与二次开发:4000 行代码,一套完整的 【AI Agent】 框架
  • 3分钟搞定GitHub加速:告别龟速下载,让代码飞起来!
  • 番茄小说下载器:打造你的私人数字图书馆,告别网络依赖
  • 终极指南:如何用ViGEmBus虚拟手柄驱动解决Windows游戏兼容性问题
  • STM32H743+SOEM+英威腾DA200伺服:一个嵌入式EtherCAT主站的完整调试笔记(含代码)
  • nthinlink用的.net版本
  • 2025_NIPS_iVideoGPT: Interactive VideoGPTs are Scalable World Models
  • 盘点全球四大海底光缆,数字孪生赋能运维巡检
  • 网盘直链解析工具:基于JavaScript的八大网盘下载地址获取方案
  • 2026年金属拉伸试验机公司口碑推荐榜,焊接拉力试验机/电池片剥离试验机/自动焊带剥离试验机/自动焊带剥离试验机 - 品牌策略师
  • ClaudeCode 通过 CC Switch 配置 Ollama 本地大模型
  • Claude API 注册被拒?国内开发者最全绕坑指南
  • 轻量化自主可控AI极简框架|离线分层隔离架构,适配国产化与安全治理战略
  • Real-Anime-Z赋能微信小程序:动漫头像生成功能落地实践
  • Agent记忆架构设计剖析系列:原理、权衡与场景适配(hermes设计原理)
  • 实测对比:Faster-LIO vs FastLIO2,iVox到底让我的Livox Mid360快了多少?
  • Spring Cloud Gateway 3.5.14 使用手册
  • 相见恨晚!5款神仙泥膜,一次改善草莓鼻 - 全网最美
  • KEYSIGHT E36233A电源远程控制方案对比:Python PyVISA vs. 官方IO Libraries Suite,哪个更适合你?
  • 释放存储空间:你的免费开源视频图像压缩神器