当前位置: 首页 > news >正文

【卷卷观察】Agent Skills 为什么突然火了?我花了一晚上研究,结论有点反直觉

结论先甩:Agent Skills 不是什么新东西,但它解决了一个很实在的问题——怎么让 AI 不要找借口,真正把活干完。


我在用 AI 写代码的时候,最烦的不是 AI 写得慢,是 AI 写完之后跟你说"测试我稍后加上"。

然后就没有然后了。

这个问题我遇到太多次了。AI 写的代码逻辑看起来没问题,但测试覆盖率 0%、边界情况没考虑、错误处理是空的。你让 AI 补,AI 说"好的我补",然后生成一堆看起来像测试的代码,实际上根本没跑通。

直到我看到 Addy Osmani 写的 Agent Skills 文章,我才意识到:问题不在 AI 本身,在于我们给 AI 的技能描述太水了。


什么是 Agent Skills

简单说,Agent Skills 就是给 AI Agent 用的"标准作业指导书"。

传统方式:你给 AI 一段文字描述,告诉它"帮我写一个用户登录功能,需要包含注册、登录、登出,密码要加密,异常情况要处理"。AI 读完,大概知道你想干嘛,然后开始写。写出来的代码能跑,但细节可能一塌糊涂。

Agent Skills 的做法是:把作业指导书变成流程图,而不是说明书。

一个 Skill 长这样:

## 测试技能 ### Step 1: 写测试 Checkpoint: - [ ] 测试覆盖率 > 80% - [ ] 所有测试通过 - [ ] 无硬编码凭证 未通过?停止执行。 ### Step 2: 验证测试确实运行 - 运行 `npm test` - 截图测试输出 - 检查覆盖率报告 未通过?停止执行。

关键差异:AI 不能说"我写了测试",必须通过 Checkpoint 才能继续。


为什么在 HN 上火了

Addy Osmani 这篇 Agent Skills 文章冲了 303 分,151 条评论。

看完 HN 评论,总结几个要点:

实用派居多。评论区没有太多人在争论"这是不是颠覆性创新",而是在讨论"这个设计能不能解决我的具体问题"。说明确实打到了痛点。

对抗 AI 借口文化。HN 评论区提到最多的一个词是anti-rationalization——反合理化。

AI 很擅长给自己找借口:

  • "这只是原型,先这样吧"
  • "测试稍后加上"
  • "重构太复杂,先不搞了"

Agent Skills 的做法是:把这些借口直接写进技能文档里,并附上反驳。"我会稍后添加测试"→ 稍后 = 永不,现在写。"能跑就行"→ 能跑不等于可维护。

这个设计太骚了。AI 看到借口,就会想起反驳。相当于给 AI 植入了一个内部监督机制。

渐进式披露节省算力。传统方式下,AI 每次任务开始都要读取大量背景信息。Agent Skills 采用渐进式披露——AI 只在真正需要时才加载对应技能的知识,对长任务链特别有意义。


跟 MCP 的关系

这是 HN 评论里很多人问的问题。

简单说:MCP 解决"接得上"的问题,Skills 解决"干得对"的问题。

MCP(Model Context Protocol)是工具调用协议——让 AI 能调用外部工具。MCP 负责的是"AI 能不能做到"。

Agent Skills 是流程规范——让 AI 按正确顺序、正确标准完成任务。Skills 负责的是"AI 做的时候会不会偷懒"。

两者是互补关系,不是替代关系。MCP 是基础设施,Skills 是上层规范。


我的踩坑经验

用 AI 写代码这么久,有几个跟 Skills 理念非常吻合的经验:

验收标准必须可量化。"测试要写得好"是废话,"测试覆盖率 > 80%"才是标准。把"做好"翻译成具体的数字指标,AI 执行起来才不会走偏。

每个节点都要有明确的退出条件。AI 任务经常虎头蛇尾——开头认真,后面糊弄。给每个步骤设置 Checkpoint,未通过就停止,逼着 AI 在每个节点都交出合格产出。

让 AI 提供执行证据,不要主观判断。AI 说"测试都通过了"——这是主观判断,不可信。AI 说"运行 npm test,输出显示 15 passed,0 failed,覆盖率 82%"——这是执行证据,可验证。Skills 的 Checkpoint 机制,就是强制 AI 提供证据而不是判断。


什么时候该用 Agent Skills

适合的场景:

  • 重复性高的任务流程(代码审查、测试生成、数据清洗)
  • 多步骤、长链路的任务(需要按顺序完成,不能跳步)
  • 团队需要固化最佳实践(把资深工程师的经验转成 Skills)
  • 对输出质量有明确标准的任务

不适合的场景:

  • 探索性任务(你都不知道答案是什么,让 AI 自由发挥)
  • 一次性小任务(写个 hello world 还要配 Skill 杀鸡用牛刀)
  • 创意类任务(写文案、做设计,Skills 规范太死板)

判断与行动建议

Agent Skills 是 2026 年最值得投入的 AI 工程化实践之一。

它的价值不在于技术多先进,而在于解决了一个很实在的问题:怎么让 AI 在实际干活的时候不摸鱼、不糊弄、不找借口。

如果你在带团队做 AI 应用落地,建议把 Skills 设计纳入开发规范:

先从高频任务开始,找到团队里重复执行最多的 3-5 个任务,为它们编写 Skills。把 Checkpoint 当成 CI,不过不了就不能继续——每个 Skill 的 Checkpoint 就是一道质量门。积累团队数字资产,Skills 是可以被版本管理、复用的团队知识,这是 AI 时代最重要的资产之一。


http://www.jsqmd.com/news/761477/

相关文章:

  • 从AlexNet到ResNeXt:用PyTorch复现7大经典图像分类网络(附完整代码与避坑指南)
  • VSCode Bookmarks插件深度指南:从代码导航到知识管理的效率革命
  • 实战工具箱:基于快马平台开发全能DLL故障排查应用,彻底告别“无法定位程序输入点”
  • 别再为离线装PyInstaller抓狂了!我踩了3小时的坑,这份保姆级避坑指南请收好
  • 匿名身份管理利器nobodywho:原理、实践与高并发优化
  • 新手如何通过快马平台轻松入门vibe coding:打造个人心情日记本
  • Docker生态资源大全:从入门到生产的容器化实践指南
  • 从‘消费者-订单’到‘汽车-驾驶员’:用Mermaid ER图实战讲透数据库关系建模(含CSS自定义样式)
  • 基于MCP协议的企业政治暴露度AI分析系统构建指南
  • 在树莓派上部署Fast-SCNN:手把手教你用PyTorch实现实时语义分割(附完整代码)
  • ARM Versatile Express配置开关与远程重置机制详解
  • Biscuit:现代Web应用的状态管理框架,实现类型安全与可组合性
  • 别再只懂 -x preset 了!Minimap2 实战:手把手教你调参搞定 PacBio HiFi 数据比对
  • 避开Web端协议坑:手把手教你用海康设备网络SDK搞定语音对讲(附Windows/Linux双环境配置)
  • Visual Studio 2022里遇到C6262警告别慌,手把手教你三种方法把大数组从栈搬到堆上
  • Dify缓存雪崩/穿透/击穿终极防御体系(2026新版TTL+布隆+本地多级缓存三重熔断)
  • 避坑指南:用Docker和源码两种方式搞定MMDetection3D环境(附CUDA、PyTorch版本匹配清单)
  • 思源宋体:开源中文字体的全栈应用实战
  • 别再为UniApp H5跨域发愁了!manifest.json和vue.config.js两种代理配置保姆级对比
  • Arm Neoverse N1 PMU架构与性能监控实践
  • 人形机器人自适应全身操作框架:强化学习与多模态感知融合
  • FastAPI 查询参数
  • 除了中科大和阿里云,Kali换源还有哪些冷门但好用的选择?实测对比
  • 手把手教你用MSP430单片机驱动DS18B20:从Proteus仿真到LCD1602显示的保姆级教程
  • 别光会跑压测!JMeter线程组参数(线程数、Ramp-Up)到底怎么设才合理?
  • RISC-V向量扩展V1.0 Spec精读:vtype、vlenb这些CSR寄存器到底怎么用?
  • Vivado里找不到ISE的IP怎么办?用源码重建AXI Slave Burst等老IP的实战记录
  • PHP 8.9垃圾回收机制重大升级:3个被官方文档隐藏的refcount优化技巧,99%开发者尚未启用
  • CVAT团队标注实战:如何用Task和Jobs功能搞定多人协同与质量管理
  • 手把手教你用FPGA驱动SHT30/SHT35温湿度传感器(附Verilog代码)