当前位置: 首页 > news >正文

为什么你必须把 Agent Skills 开发,变成严谨的软件工程?(限时试读)

大家好,我是Tony Bai。

我是你的老朋友,一个正在被 AI 疯狂“内卷”的程序员。

如果你最近几个月一直在使用 Cursor、Claude Code 或者其他各种 AI 编程助手,你大概率会经历一个情绪的“过山车”:

第一天:“卧槽,太牛了!这代码它自己就写完了!”

第一周:“等等,这段逻辑有点怪,我得去修一下它的 Bug。”

第一个月:“崩溃了……我给它写了 500 行的 Prompt,它还是会在同一个地方犯错。而且,它昨天明明写对了,今天稍微换个问法,它又按老套路瞎编了一遍!”

这就是我们当前面临的真实困境。

我们正处在一个尴尬的过渡期:AI 写代码的速度远远超过了我们人类 Review 和兜底的速度。当我们试图用更长、更复杂的 Prompt 去控制 AI 时,我们发现自己变成了一个“疲于奔命的手工作坊老板”

你精心雕琢的 Prompt,就像是一本厚厚的员工手册。你把它塞给一个记忆力只有 7 秒、充满迷之自信、速度极快的“初级天才开发”。结果就是,他偶尔能超常发挥,但大多数时候,他会把事情搞砸,而且你根本不知道他为什么搞砸。

靠“玄学 Prompt”来驱动 AI 的时代,已经一去不复返了。

为什么你觉得无力?因为你在用“黑盒”对抗“黑盒”

为了解决这个问题,业界开始推出各种“技能(Skill)”或者“智能体(Agent)”框架。你可以把一套工作流、最佳实践、甚至是工具库打包成一个 Skill,让 AI 在需要的时候调用。

这听起来很完美,对吧?

于是,你开始尝试用一些自动化工具(比如 Anthropic 的skill-creator或者各种自研的 Agent 平台)来帮你写 Skill。你输入一句“帮我写一个分析日志的技能”,工具咔咔咔一顿输出,生成了一堆配置文件和 Markdown。

你测试了一下,好像能用。

但当你把它投入真实的生产环境时,灾难开始了:

  • 触发率成迷:用户明明说了“帮我看看日志”,AI 却死活不加载这个 Skill。

  • 指令“漂移”,输出不稳定:面对结构稍微不同的日志,它就开始胡编乱造。

  • 薛定谔的复现率:同一个任务,昨天它完美执行,今天你稍微换了个问法,它就彻底无视了整个 Skill 的存在,开始自由发挥。

  • 难以迭代:你想加个新功能,结果旧功能莫名其妙就退化了。

面对这些自动生成的代码和配置,你感到一种深深的无力感。因为对你来说,这个 Skill 是一个“黑盒”,而生成它的那个工具,是另一个“黑盒”

当系统出问题时,你甚至不知道该修改哪一行字。

打破黑盒:把 AI 技能开发,变成严谨的软件工程

如果我们要真正驾驭 AI,让它成为我们可靠的队友,而不是一颗随时会爆的定时炸弹,我们就必须抛弃“调包侠”和“按键猴子”的心态。

我们需要将 AI 技能(Agent Skill)的开发,视为一项严肃的软件工程

这也是我策划这门微专栏的初衷。我将它命名为:《打破黑盒:用工程思维构建工业级 Agent Skill》

在这门专栏中,我不会教你那些几个月后就会失效的“Prompt 奇技淫巧”。相反,我将带你深入底层,拆解一个高质量工业级 Skill 诞生的全生命周期。

我的核心观点只有两个:

  1. 不要逆势而为,必须“用 AI 制造 AI”。面对复杂的上下文和多步推理,人类的手写能力已经触及天花板。我们必须学会熟练使用类似skill-creator这样的自动化工具,利用多智能体协作(Multi-Agent Collaboration)来帮我们生成、测试和优化 Skill。

  2. 绝不接受“黑盒”。我们必须站在“上帝视角”,深刻理解这些自动化工具内部的运行机制。我们需要知道:

  • AI 是如何“阅读”和“加载”一个技能规范(Spec)的?

  • 在自动化测试中,那个负责打分的“裁判智能体(Grader)”是按照什么标准来评判好坏的?

  • 当需要评估两个版本哪个更好时,那个“盲测智能体(Blind Comparator)”是如何排除偏见,给出量化数据的?

  • 最后,那个负责迭代的“分析师智能体(Analyzer)”是如何通过分析执行轨迹(Transcript),找出失败的根本原因,并给出改进建议的?

只有看懂了裁判的打分规则,你才能写出满分的卷子。只有理解了系统底层的齿轮是如何咬合的,你才能在遇到触发率低、输出不稳定等问题时,精准地进行降维打击,而不是像无头苍蝇一样乱改 Prompt。

你将在这个微专栏中获得什么?

这门专栏共 7 讲,每一讲都是一次认知升级和实战演练:

  • 第 1 讲 | 开篇:手工作坊的终结,为什么你必须学会“用 AI 制造 AI”?(就是你现在看到的这篇)

  • 第 2 讲 | 拆解 Skill Spec:揭秘 AI “理解”与“按需加载”技能的底层逻辑

  • 第 3 讲 | 启动引擎:从“模糊意图”到“高潜草稿”的自动化生成之路

  • 第 4 讲 | 拒绝玄学:构建可量化的 Eval 断言与全自动测试流水线

  • 第 5 讲 | 盲测与进化:让 AI 裁判自己证明“新版本比老版本强”

  • 第 6 讲 | 榨干最后 1% 精度:用数据驱动的 Benchmark 彻底解决触发难题

  • 第 7 讲 | 交付与升华:从打包部署到构建“人机混合”的新一代研发体系

我希望,通过这门专栏的学习,你能完成从“被 AI 牵着鼻子走的打字员”到“能够指挥一支硅基研发车队的超级架构师”的蜕变。

在这个全新的时代,代码的生成速度不再是壁垒,如何定义规范、如何编写断言(Assertions)、如何设计基准测试(Benchmark)、如何建立评估体系(Eval),才是工程师真正的护城河。

准备好打破黑盒,迎接挑战了吗?

👇👇👇

立即点击此处订阅专栏,或者扫描下方二维码,让我们一起,用工程思维,重新定义 AI 时代的开发范式!



如果本文对你有所帮助,请帮忙点赞、推荐和转发

点击下面标题,干货!

- 还在当“上下文搬运工”?我写了一门课,帮你重塑AI开发工作流

- 都在用 OpenClaw 跑 Skill,但你写的“技能”为什么总让 AI 频繁罢工?

- 继 MCP 之后,Anthropic 再放大招:Agent Skills 正式发布为开放标准!

- 停止“氛围编程”(Vibe Coding),拥抱新一代软件工程

- 打破“知识诅咒”:资深架构师在 OpenClaw 浪潮中的掉队与反思


🔥 还在为“复制粘贴喂AI”而烦恼?我的新极客时间专栏《AI原生开发工作流实战》将带你:

  • 告别低效,重塑开发范式

  • 驾驭AI Agent(Claude Code),实现工作流自动化

  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码👇,开启你的AI原生开发之旅。

http://www.jsqmd.com/news/506706/

相关文章:

  • Holynix靶机实战:不用Burp Suite也能玩转SQL注入与文件上传(附完整命令)
  • AI减负,病历提速|让医生专心看病!
  • GitHub_Trending/ms/MS-DOS源代码中的条件跳转:控制流实现
  • 2024-2026年固态硬盘品牌推荐:国产化生态兼容存储设备与长期服务支持盘点 - 品牌推荐
  • CIFAR-100模型性能对比:Top1与Top5错误率深度解析
  • Weaviate数组类型ContainsAny操作符:版本兼容性问题终极解析指南
  • 深入ByteTrack算法:YOLOv8目标跟踪背后的卡尔曼滤波优化技巧
  • 新手避坑指南:用BurpSuite和Sqlmap搞定CISP-PTE文件包含与命令执行题
  • 2026年固态硬盘品牌推荐:工业控制与极端环境应用高稳定性型号盘点 - 品牌推荐
  • 探讨天然彩色鹅卵石滤料,湖北安然建材怎么收费? - 工业推荐榜
  • 2025-2026年固态硬盘品牌推荐:航天军工领域高可靠存储口碑品牌盘点 - 品牌推荐
  • 糖尿病视网膜病变诊断新突破:细粒度分割与多任务学习的融合实践
  • 基于Rust架构的番茄小说下载器技术实现与应用实践
  • 2026年固态硬盘品牌推荐:企业数据中心高负载稳定运行靠谱品牌与选购指南 - 品牌推荐
  • 进口地板十大品牌怎么选?2026热门品牌测评+选购指南看这篇! - 匠言榜单
  • 如何快速实现Fiber集成测试:使用TestContainers的完整指南
  • 2024-2026年中频炉厂家推荐:再生资源回收高效熔炼热门厂家与真实评价对比 - 品牌推荐
  • IDEA私人注释神器:private-notes插件保姆级教程(含快捷键大全)
  • 在蒙尘之前,让光透进来 ——基于“青年玄学热”现象的现象学反思
  • 聊聊在线式UVLED固化机选购,广州地区哪些企业值得推荐? - 工业推荐榜
  • 极链云服务器跑Python代码保姆级教程:从文件上传到命令行执行
  • Backtrader回测数据准备全攻略:从Tushare到Akshare的平滑迁移指南
  • 终极算法可视化指南:通过cp-algorithms项目直观理解复杂数据结构与算法过程
  • 如何在矿业设备日志分析中应用Fuzzywuzzy模糊字符串匹配技术
  • 2026年固态硬盘品牌推荐:企业数据中心高负载场景稳定运行优选型号 - 品牌推荐
  • 中频炉厂家如何选不踩坑?2026年靠谱推荐汽车铸件生产用高效且节能型号 - 品牌推荐
  • 一键智能开发:合宙 MCP 工具全新上线
  • [CTF] 从零到一:SSRF漏洞利用与绕过实战
  • 终极指南:gitsome命令行工具未来功能预测与社区热门需求解析
  • 突破硬件限制:老旧Mac焕发新生的OpenCore Legacy Patcher全攻略