当前位置: 首页 > news >正文

别再给AI塞提示词了:Skill正在重塑Agent的能力边界

最近一段时间,Agent 生态里一个明显的变化是:大家不再执着于“给模型塞更多提示词”,而是开始认真思考——能力应该如何被组织、被调用、被复用。

在这一轮讨论中,OpenClaw 的 Skill 体系被不少开发者反复提及。它并没有试图再造一个“更大的模型”,而是选择了一条更工程化的路:把 AI 的能力拆成一个个可插拔、可复用、可进化的单元,在真正需要的时候再加载。

如果你之前用过 Agent,却总觉得“它好像什么都会一点,但又什么都不稳”,那么理解 Skill 的设计思路,会是一个关键转折点。

Skill 不是插件,而是一种“能力组织方式”
在 OpenClaw 的语境里,Skill 并不等同于传统意义上的插件。

插件更像是提前安装好的功能模块,而 Skill 更接近一种被描述、被理解、被按需调用的能力。它用自然语言定义自己能做什么、适合在什么情况下使用,同时保留了足够清晰的边界和限制。

这背后有一个很现实的工程考量:大模型的上下文窗口是有限的。如果一开始就把所有工具、所有能力一股脑塞进去,不但浪费 token,还会让模型在关键决策时分心。

所以 Skill 的核心思想不是“我能做什么都告诉你”,而是——等你真的需要我时,我再把细节交出来。

为什么渐进式披露,正在成为 Agent 体系的分水岭
很多早期 Agent 项目都会遇到一个问题:工具越加越多,效果反而变差。

原因并不神秘。模型在面对大量工具描述时,既要理解当前任务,又要判断该用哪个工具,本身就会出现注意力稀释。而渐进式披露,正是为了解决这个问题而生的。

在 OpenClaw 的设计中,Skill 的加载被拆成了三个阶段。系统启动时,只读取极简的能力索引,用来判断“哪些 Skill 可能有用”;当用户的输入真的匹配到某个场景时,才加载对应 Skill 的完整定义;而真正执行时,才引入具体的上下文、参数和中间结果。

这种设计带来的变化非常直观。Agent 启动更快了,对话成本更低了,更重要的是——工具选择的准确率明显提升。模型不再是在一堆工具中“猜”,而是在少量、强相关的能力中“选”。

一个真实场景:为什么微信文章总是“抓不到正文”
理论说得再多,不如一次真实的踩坑。

2 月底的一次使用中,有用户在对话里直接丢了一条微信公众号文章链接,希望 AI 帮忙总结内容。第一反应很自然:直接用 web_fetch 抓取页面。

结果并不意外。返回的只有“继续滑动看下一个”等提示文字,正文几乎为空。

抓取失败的"三层防御"
不仅仅是"JS渲染"的问题,微信公众号文章的抓取难度,实际上是三层防御机制的叠加:

防御层级
技术原理
为什么web_fetch会失败
第一层:Cookie鉴权
微信要求请求必须携带有效的 wap_sid2 Cookie,这个Cookie是用户登录微信网页版时下发的,有时效性且与IP绑定。
web_fetch 默认不带Cookie,或者带的是无效/过期的Cookie,直接被服务端拒绝返回正文。
第二层:动态渲染
文章正文确实由JavaScript动态加载,但这不是为了防爬,而是SPA(单页应用)的架构使然。正文数据通常通过一个独立的API接口获取,然后由JS插入DOM。
web_fetch 只获取HTML骨架,不执行JS,自然拿不到JS插入的内容。
第三层:反爬策略
微信会检测 User-Agent、Referer 等请求头,如果看起来不像真实浏览器(比如用Python的requests库),会返回"请求过于频繁"或直接重定向到登录页。
web_fetch 的默认请求头很容易被识别为非浏览器。
这不是工具失效,而是微信文章本身的加载方式决定的——三层防御机制让简单的HTTP请求根本无法穿透。

从一次失败,到一个可复用的 Skill
既然问题在于渲染,那解决思路就很明确了:用浏览器,而不是接口。

基于这个判断,一个名为 wechat-article-viewer 的 Skill 被设计出来。它并不复杂,但每一步都很“工程化”:先检查浏览器是否已连接,再打开文章链接,等待页面完整渲染后抓取快照,最后从结构化的 HTML 中提取标题、作者和正文内容。

"检查浏览器是否已连接"到底有多复杂
这句话听起来简单,但实际工程实现中,它隐含了一整套环境管理、状态检测和用户引导的逻辑。

一个健壮的连接检查至少需要检测三层状态:

def check_browser_connection():
"""返回详细的连接状态,而不是简单的True/False"""
status = {
"connected": False,
"has_debug_port": False,
"has_wechat_login": False,
"user_guidance": ""
}

# 1. 调试端口是否可连接?
if not is_port_open("localhost", 9222):status["user_guidance"] = "请先启动带调试端口的Chrome"return status# 2. 浏览器是否能正常通信?
try:browser = connect_to_browser(9222)status["has_debug_port"] = True
except:status["user_guidance"] = "浏览器端口已占用但无法连接"return status# 3. 浏览器里有没有微信登录态?
if not check_wechat_cookie(browser):status["user_guidance"] = "请先在浏览器中登录微信网页版"return statusstatus["has_wechat_login"] = True
status["connected"] = True
return status

更难的是用户体验的"最后一公里":如何让普通用户理解并执行"用调试端口启动浏览器"?成熟的Skill设计会包含:

分步指引:第一次使用时需要做什么
状态诊断:告诉用户"你现在卡在哪一步"
降级方案:实在不行时,有没有替代办法
真正关键的不是“这次文章能不能读到”,而是这些步骤被完整封装进了 SKILL.md 中。触发条件、使用场景、执行流程,都被清楚地写了下来。

于是,下次再有人丢进来一个 mp.weixin.qq.com 的链接,Agent 不需要重新推理“该怎么办”,而是可以直接调用这段已经验证过的能力。

Skill 带来的改变,不只是“省一步操作”
在这次实战中,同一篇接近 1.5 万字的长文,被完整提取并结构化总结。而对比实验也很清楚:如果继续使用 web_fetch,结果依旧只有零散提示文字。

但真正值得注意的,并不是“这次成功了”,而是 Skill 带来的几个长期变化。

首先,经验不再是一次性的。解决微信反爬虫这件事,不再依赖某个工程师记得“上次是怎么搞的”,而是沉淀成了一个可继承的能力。

其次,AI 的行为开始变得可预期。当触发条件明确、流程固定之后,Agent 的表现不再像“临场发挥”,而更像是在执行一套经过验证的方案。

最后,协作成本被显著降低。Skill 写好一次,就可以被团队反复使用,甚至被其他人直接拿走复用,而不需要重新讲一遍背景。

人工智能技术学习交流群
伙伴们,对AI测试、大模型评测、质量保障感兴趣吗?我们建了一个 「人工智能测试开发交流群」,专门用来探讨相关技术、分享资料、互通有无。无论你是正在实践还是好奇探索,都欢迎扫码加入,一起抱团成长!期待与你交流!👇

image

Skill,正在把 AI 拉回工程世界
OpenClaw 的 Skill 体系,其实代表了一种很克制的 AI 观。

它并没有强调“模型多聪明”,而是把重点放在:能力如何被描述、被加载、被复用。这更像软件工程,而不是魔法。

当 AI 真正进入业务、进入测试、进入日常工作之后,这种工程化的设计反而会成为决定体验上限的关键因素。

模型会不断更新,平台会不断变化,但把经验封装成 Skill、让能力按需加载的思路,很可能会长期存在。

至少在今天,它已经让一件原本很烦的事——“帮我读一下这篇微信文章”,变成了一次稳定、可复用的能力调用。

而这,或许正是 Agent 走向成熟的一个信号。

推荐学习
AI Agent进阶 OpenClaw + Claude Code公开课,手把手带你掌握 从“网页操控”到“终端自主编程”的执行力。

扫码进群,报名学习。

image

关于霍格沃兹测试开发学社

霍格沃兹测试开发学社,隶属于 测吧(北京)科技有限公司,是一个面向软件测试爱好者的技术交流社区,聚焦软件测试、软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及人工智能测试(AI 测试)等方向。
学社内容覆盖 Python 自动化测试、Java 自动化测试、Web 自动化(Selenium、Playwright、App 自动化(Appium)、JMeter、LoadRunner、Jenkins 等测试技术与工具,同时关注 AI 在测试设计、用例生成、自动化执行、质量分析与测试平台建设中的应用,以及开源测试相关实践。
在人才培养方面,学社建设并运营高校测试实训平台,组织 “火焰杯” 软件测试相关技术赛事,探索面向高校学员的实践型培养模式,包括先学习、就业后付款等能力导向路径。
此外,学社还提供面向测试工程师的能力提升支持,包括名企大厂 1v1 私教服务,用于结合个人背景的定向指导与工程能力提升。

http://www.jsqmd.com/news/407473/

相关文章:

  • 2026年深圳AI搜索排名优化公司年度排名,哪家靠谱? - mypinpai
  • 从零开始:用Nano-Banana Studio完成首个服装拆解项目
  • 2026CRM选型指南:4大主流品牌横向对比 - 毛毛鱼的夏天
  • 整理2026年青岛汽车窗膜贴膜服务,哪家靠谱费用合理 - 工业推荐榜
  • C++高性能应用集成Qwen3-TTS-12Hz-1.7B-CustomVoice
  • 两小时登顶ClawHub,这个AI插件到底做了什么?
  • 大厂Java面试场景:从语言基础到微服务应用
  • 聊聊上海口碑不错的专业公司注册品牌,哪家性价比高 - 工业设备
  • C++的指针 、 、* 、值传递、地址传递、引用传递
  • 零基础入门:手把手教你用Asian Beauty生成东方风格人像
  • 2026CRM系统解析:超兔、Dynamics 365 等 4 大平台全链路管理能力评测 - 毛毛鱼的夏天
  • 跨团队协作:敏捷面试场景应对——软件测试人才评估新范式
  • 测试工程师如何用AI拆需求?从“看不懂”到“可测试”
  • 2026年佛山GEO优化/AI搜索排名厂家推荐意合云,智能全域优化技术领先 - 品牌企业推荐师(官方)
  • AI绘画新选择:Z-Image Turbo极速体验报告
  • Ubuntu20.04部署实时口罩检测模型:完整环境配置指南
  • Qwen3-ForcedAligner-0.6B在QT跨平台应用中的集成方案
  • 聊聊永亚智能有机肥设备的品牌影响力,选购靠谱设备看这里 - myqiye
  • Qwen3-ASR-0.6B低成本GPU方案:GTX1660 Super实测可用的轻量部署指南
  • RetinaFace人脸检测模型在安防领域的落地实践
  • 5分钟搞定!用Fish Speech 1.5制作个性化语音助手
  • Gemini 3.1 Pro 发布:一次真正意义上的推理能力跃迁
  • 【GitHub项目推荐--Claude-Mem:Claude Code的持久内存压缩系统】
  • 基于YOLOv8和Qwen3-TTS的智能监控语音报警系统
  • Qwen3-Reranker-4B与LangChain集成:构建智能检索增强生成系统
  • 镁球粘合剂优选:2026年口碑厂家大比拼,超级生粉/粘合剂/宠物饲料淀粉/食用面碱/造纸淀粉,粘合剂实力厂家排行榜 - 品牌推荐师
  • AnimateDiff问题解决:常见报错与显存优化技巧汇总
  • UI-TARS-desktop保姆级教程:从安装到实战全流程
  • FLUX.小红书极致真实V2惊艳生成:弱光环境、逆光人像、雨天玻璃窗反射等复杂场景
  • 2026评测:中低压管件新趋势,高压管件优质厂家推荐,高压管件/异径管件/三通管件/保温管道/合金管道,高压管件品牌推荐 - 品牌推荐师