当前位置：首页 > news >正文

【为什么大佬的 Hermes 越用越聪明？答案藏在这 5 个 Skill 里】

news 2026/6/26 9:43:55

📑 文章目录

📌 一、为什么你的 Hermes 越用越笨？90% 的人都踩了 3 个坑
🏗️ 二、什么是 Hermes Skill？不是 prompt，是 Agent 的 “能力基因”
🧠 三、让 Hermes 越用越聪明的 5 个核心 Skill（可直接复制）
⚠️ 四、Skill 设计的 4 大黄金法则（避坑必看）
📋 五、实战：30 分钟给 Hermes 装上第一个生产级 Skill
🎯 六、5 个 Skill 速查卡
🔮 七、未来展望：Skill 之后，Hermes 的进化终点
🎁 总结

📌 一、为什么你的 Hermes 越用越笨？90% 的人都踩了 3 个坑

先戳破一个真相：Hermes 本身不会 “越用越聪明”，只会 “越用越贴合你的设计”。你用不起来，本质是踩了这 3 个致命误区：

坑 1：把 Skill 当成了高级 prompt

绝大多数人对 Hermes Skill 的理解，就是 “一段写得长一点的 prompt”，比如 “你是资深 Python 工程师，帮我写高质量代码”。但这种 “无边界、无约束、无评估” 的文本，根本不是 Skill—— 它没有闭环，没有工具权限，没有记忆沉淀，每次执行都是从零开始，自然越用越乱。

坑 2：Skill 没有反馈闭环，用完就忘

Hermes 聪明的核心，是从每次执行中学习优化。但大多数人的 Skill，执行完就结束了，不会把这次的成功经验、踩过的坑、你的偏好沉淀下来。这次你让它 “别用 eval 函数”，下次它照样写；这次踩了 SQL 注入的坑，下次还会裸写 SQL—— 没有记忆和反馈，自然永远不会进步。

坑 3：权限与边界混乱，要么躺平要么失控

要么给 Skill 开了全量权限，结果它乱删文件、修改生产配置，你不敢用；要么把权限锁死，它连读取项目文件都做不到，只能瞎写代码，根本用不起来。没有清晰的边界和安全护栏，Skill 要么失控，要么残废，根本谈不上持续进化。

🏗️ 二、什么是 Hermes Skill？不是 prompt，是 Agent 的 “能力基因”

先给一个明确的、来自 Karpathy Skills 项目的定义：Hermes Skill 是给 Agent 封装好的、可复用、可迭代、有明确边界、带反馈闭环、可量化评估的能力单元。它不是一次性的指令，而是 Hermes 的 “肌肉记忆” 和 “进化底座”—— 每执行一次，就会优化一次，用得越多，能力越强。

用一张表说清，Skill 和普通 prompt 的本质区别：

表格

维度	普通 Prompt	Hermes Skill
执行逻辑	一次性指令，执行即结束	闭环流程，执行→评估→沉淀→优化
能力边界	无明确约束，全靠文本描述	明确的工具权限、输入输出、禁止事项
记忆能力	仅依赖上下文窗口，用完即忘	自带长期记忆，可跨会话沉淀经验
质量保证	纯靠人工审查，无标准	内置评估体系，不达标自动迭代
复用性	单次场景可用，换项目就废	标准化封装，全项目、全团队通用
进化能力	固定不变，不会自我优化	可通过反馈持续迭代，越用越聪明

一句话总结：Prompt 是你教 Hermes “做一件事”，而 Skill 是你给 Hermes 植入了 “做好一类事的能力”，这就是大佬的 Hermes 越用越聪明的核心密码。

🧠 三、让 Hermes 越用越聪明的 5 个核心 Skill（可直接复制）

这 5 个 Skill 是我半年来在生产环境打磨出来的，从基础规范到自我迭代，层层递进，完全适配 Hermes 原生框架与 MCP 协议，复制即可直接导入使用。

Skill 1：代码规范对齐 Skill（基础底座）

核心作用：让 Hermes 的输出 100% 贴合你 / 团队的代码规范，从根源上解决风格乱飞、命名混乱的问题，越用越懂你的编码习惯。这是所有 Skill 的基础 —— 如果 Hermes 连你的规范都记不住，写再多代码都是垃圾。

python

运行

# 规范对齐Skill - Hermes 原生格式 class CodeStandardSkill: def __init__(self): self.skill_name = "code_standard_alignment" self.version = "1.0.0" self.description = "严格对齐项目代码规范，所有输出必须符合预设标准" # 可自定义的规范配置，支持团队统一维护 self.standard_config = { "tech_stack": ["Python", "FastAPI", "PostgreSQL", "pytest"], "code_rules": [ "所有函数必须带完整类型注解与docstring", "所有公共API必须有完整异常处理与日志", "数据库操作必须使用ORM参数化查询，禁止裸写SQL", "禁止使用eval/exec等危险函数，禁止硬编码密钥", "命名遵循PEP8规范，类名大驼峰，函数名蛇形" ], "forbidden_actions": [ "修改项目根目录配置文件", "删除非本次生成的代码文件", "跳过测试直接提交代码" ], "workflow": [ "执行前先读取项目根目录CLAUDE.md规范文件", "按规范生成代码", "生成后自动用eslint/flake8做格式校验", "校验不通过自动修复，直到符合规范" ] } # 记忆模块：沉淀历史规范适配经验 self.memory = [] def execute(self, task_context: dict) -> dict: # 1. 加载项目规范，合并历史适配经验 project_standard = self._load_project_standard(task_context["project_path"]) historical_experience = self._get_historical_experience(task_context["developer_id"]) # 2. 注入规范约束到任务上下文 task_context["standard"] = {**self.standard_config, **project_standard} task_context["historical_experience"] = historical_experience # 3. 执行代码生成与规范校验 result = self._generate_and_validate(task_context) # 4. 沉淀本次适配经验到长期记忆 if result["status"] == "success": self._save_experience(task_context["developer_id"], result["adaptation_points"]) return result

进化逻辑：每次执行都会沉淀 “你对规范的特殊偏好”，比如你喜欢把日志单独抽成工具类、不喜欢嵌套三元表达式，用得越多，它的输出越贴合你的习惯，甚至能预判你的规范要求。

Skill 2：测试驱动闭环 Skill（质量核心）

核心作用：给 Hermes 植入 “测试先行” 的工程思维，生成代码必写单测、单测不通过自动修复、修复后自动回归，形成完整的质量闭环，越写越稳，彻底告别 “Demo 好看，上线就崩”。这是从 Vibe Coding 到 Agentic Engineering 最关键的一步。

python

运行

# 测试驱动闭环Skill class TDDCycleSkill: def __init__(self): self.skill_name = "tdd_cycle_executor" self.version = "1.2.0" self.description = "测试驱动开发闭环，先写测试用例，再实现代码，自动修复直到全量测试通过" self.available_tools = ["read_file", "write_file", "run_pytest", "search_code"] self.eval_standard = { "min_test_coverage": 85, "max_cyclomatic_complexity": 5, "forbid_zero_assert": True } # 记忆模块：沉淀历史bug修复经验 self.bug_fix_memory = [] def execute(self, task_context: dict) -> dict: # 1. 拆解需求，生成测试用例 test_cases = self._generate_test_cases(task_context["requirement"]) self._write_test_file(test_cases, task_context["test_path"]) max_iter = 5 current_iter = 0 while current_iter < max_iter: # 2. 运行测试，获取失败结果 test_result = self._run_tool("run_pytest", {"path": task_context["test_path"]}) # 3. 测试全量通过，进入覆盖率校验 if test_result["return_code"] == 0: coverage_result = self._check_coverage(task_context["test_path"]) if coverage_result["coverage"] >= self.eval_standard["min_test_coverage"]: # 沉淀本次测试与修复经验 self._save_bug_fix_experience(task_context["project_id"], test_result["fix_points"]) return {"status": "success", "test_result": test_result, "coverage": coverage_result} # 4. 测试失败，结合历史修复经验自动修复 current_iter += 1 fix_prompt = self._build_fix_prompt( test_result["error_msg"], self._get_similar_fix_experience(test_result["error_type"]) ) self._fix_code(fix_prompt, task_context["code_path"]) # 5. 超过最大迭代次数，触发人工介入 return {"status": "need_human", "error_msg": "超过最大迭代次数，需人工确认需求与测试用例"}

进化逻辑：每次修复 bug 都会沉淀到记忆库，遇到同类错误时，会直接复用历史最优修复方案，修复速度越来越快，踩过的坑不会再踩第二次，代码质量持续提升。

Skill 3：上下文记忆沉淀 Skill（懂你的核心）

核心作用：让 Hermes 真正 “记住” 你的项目、你的业务、你的偏好，跨会话、跨项目复用经验，彻底告别 “每次都要重新讲一遍项目背景” 的痛苦，越用越懂你。这是 Hermes 从 “工具” 变成 “搭档” 的关键。

python

运行

# 上下文记忆沉淀Skill class ContextMemorySkill: def __init__(self): self.skill_name = "context_memory_manager" self.version = "1.1.0" self.description = "管理项目全生命周期记忆，沉淀业务逻辑、开发偏好、踩坑经验，跨会话复用" # 三层记忆体系，适配Agentic Engineering self.memory_level = { "short_term": "当前会话上下文，滑动窗口管理", "work_term": "当前项目全量信息，状态机持久化", "long_term": "跨项目开发经验，向量数据库存储" } self.vector_db = None # 适配Chroma/Pinecone def execute(self, task_context: dict) -> dict: # 1. 检索相关记忆，注入上下文 related_memory = self._retrieve_memory( query=task_context["requirement"], project_id=task_context["project_id"], developer_id=task_context["developer_id"], top_k=5 ) task_context["related_memory"] = related_memory # 2. 执行核心任务 core_result = self._execute_core_task(task_context) # 3. 拆分本次执行的有效信息，分层沉淀 memory_to_save = self._split_memory(core_result) # 短期记忆：存入当前会话 self._save_short_term_memory(memory_to_save["short_term"], task_context["session_id"]) # 工作记忆：存入项目状态机 self._save_work_term_memory(memory_to_save["work_term"], task_context["project_id"]) # 长期记忆：向量化存入向量库 self._save_long_term_memory(memory_to_save["long_term"], task_context["developer_id"]) return {**core_result, "memory_updated": True} # 记忆检索：优先匹配同项目、同业务场景的经验 def _retrieve_memory(self, query: str, project_id: str, developer_id: str, top_k: int = 5): project_memory = self.vector_db.search( filter={"project_id": project_id}, query=query, top_k=3 ) personal_memory = self.vector_db.search( filter={"developer_id": developer_id}, query=query, top_k=2 ) return {"project_memory": project_memory, "personal_memory": personal_memory}

进化逻辑：用得越多，它对你的项目业务、编码偏好、踩坑历史记得越清楚。比如你做过电商订单系统，下次再做支付相关功能时，它会自动复用之前的幂等性设计、异常处理方案，不用你再重复交代。

Skill 4：多工具编排 Skill（能力拓展核心）

核心作用：让 Hermes 不再只会 “写代码”，而是会自主组合工具完成复杂任务 —— 查官方文档、跑性能测试、扫安全漏洞、做代码合并、甚至发版上线，能力边界持续拓展，越用越全能。

python

运行

# 多工具编排Skill class MultiToolOrchestrationSkill: def __init__(self): self.skill_name = "multi_tool_orchestrator" self.version = "1.3.0" self.description = "自主规划工具调用顺序，组合多工具完成复杂开发任务，支持错误重试与降级" # 标准化工具集，适配MCP协议，可自由扩展 self.registered_tools = { "read_file": "读取项目内指定文件内容", "write_file": "写入内容到指定文件，仅覆盖本次修改内容", "run_tests": "运行项目测试套件，返回测试结果与覆盖率", "search_docs": "检索官方技术文档，获取最新API规范", "security_scan": "扫描代码安全漏洞，返回风险点与修复方案", "git_operation": "git分支管理、代码提交、PR创建", "ask_human": "不确定时向人类提问，禁止擅自决策高风险操作" } self.tool_call_rules = { "max_call_depth": 3, "retry_times": 2, "high_risk_tools": ["write_file", "git_operation"], "need_human_approval": ["git_push", "modify_prod_config"] } # 记忆模块：沉淀工具组合最优方案 self.tool_combination_memory = [] def execute(self, task_context: dict) -> dict: # 1. 拆解任务，规划工具调用链路 task_plan = self._build_task_plan(task_context["requirement"]) tool_chain = self._plan_tool_chain(task_plan, self.registered_tools) # 2. 按链路执行工具调用，支持动态调整 result = {"status": "running", "steps": []} for step in tool_chain: # 高风险操作触发人工审批 if step["tool"] in self.tool_call_rules["need_human_approval"]: human_confirm = self._call_tool("ask_human", {"question": step["confirm_question"]}) if not human_confirm["approved"]: return {"status": "terminated", "reason": "人类拒绝高风险操作"} # 执行工具调用，失败自动重试 step_result = self._execute_tool_with_retry(step, self.tool_call_rules["retry_times"]) result["steps"].append(step_result) # 执行失败，结合历史经验调整工具链 if step_result["status"] == "failed": new_tool_chain = self._adjust_tool_chain( step_result["error_msg"], tool_chain, self._get_similar_tool_experience(step_result["error_type"]) ) tool_chain = new_tool_chain # 3. 沉淀本次工具组合最优方案 self._save_tool_combination_experience(task_context["task_type"], tool_chain, result) return {"status": "success", "execution_result": result}

进化逻辑：每次执行都会沉淀 “什么场景用什么工具组合效率最高”，比如修复依赖版本问题时，它会先查官方兼容文档，再改依赖文件，再跑集成测试，而不是瞎改版本号。用得越多，工具调用越精准，越不会瞎操作。

Skill 5：自我迭代优化 Skill（终极进化）

核心作用：让 Hermes 自己复盘自己的执行过程，优化 Skill 本身的逻辑、工具链、评估标准，实现 “自我进化”—— 不用你手动改 Skill，它自己会越用越聪明。这是大佬的 Hermes 和普通玩家拉开差距的终极 Skill。

python

运行

# 自我迭代优化Skill class SelfIterationSkill: def __init__(self): self.skill_name = "self_iteration_optimizer" self.version = "2.0.0" self.description = "复盘Agent执行全流程，自主优化Skill逻辑、工具链、评估标准，实现持续进化" self.optimization_dimensions = [ "执行成功率", "平均迭代次数", "代码质量评分", "工具调用准确率", "人类干预率" ] self.optimization_threshold = { "success_rate_below": 90, "human_intervention_rate_above": 20 } # 全量执行历史，用于迭代分析 self.execution_history = [] def execute(self, task_context: dict) -> dict: # 1. 拉取近10次执行历史，做多维度复盘 recent_history = self._get_recent_execution_history(task_context["skill_name"], limit=10) analysis_report = self._analyze_execution_history(recent_history, self.optimization_dimensions) # 2. 判断是否需要优化 if not self._need_optimization(analysis_report, self.optimization_threshold): return {"status": "no_optimization_needed", "analysis_report": analysis_report} # 3. 生成优化方案，修改Skill配置 optimization_plan = self._generate_optimization_plan(analysis_report, task_context["current_skill_config"]) updated_skill_config = self._update_skill_config(optimization_plan, task_context["current_skill_config"]) # 4. 灰度验证优化效果 validation_result = self._gray_validate(updated_skill_config, task_context["validation_tasks"]) if validation_result["success_rate"] > analysis_report["current_success_rate"]: # 优化生效，更新正式Skill配置 self._publish_skill_update(task_context["skill_name"], updated_skill_config, optimization_plan) return { "status": "optimization_success", "old_config": task_context["current_skill_config"], "new_config": updated_skill_config, "effect_estimate": validation_result } # 优化无效，回滚并记录 return {"status": "optimization_failed", "reason": validation_result["reason"], "analysis_report": analysis_report}

进化逻辑：它会自己复盘 “为什么这次任务迭代了 5 次才成功”“为什么这次人类干预了 3 次”，然后自动优化 Skill 的流程、工具链、评估标准。比如它发现测试覆盖率要求 85% 会导致迭代次数过多，会自动调整为核心逻辑覆盖率 100%、工具函数覆盖率 80%，在保证质量的同时提升效率 —— 真正实现越用越聪明，自己给自己升级。

⚠️ 四、Skill 设计的 4 大黄金法则（避坑必看）

这是我踩了无数坑总结出来的法则，只要遵守，你的 Skill 就不会跑偏：

单一职责法则：一个 Skill 只做一件事，不要把 “代码生成” 和 “安全扫描” 塞到一个 Skill 里。越聚焦，越稳定，越容易迭代。
闭环反馈法则：每个 Skill 必须有 “执行→评估→沉淀→优化” 的完整闭环，没有反馈的 Skill，永远不会进化。
边界可控法则：明确 Skill 的可用工具、禁止操作、权限范围，高风险操作必须加人工审批。安全是 Skill 能长期用的前提。
可量化评估法则：每个 Skill 必须有明确的成功标准，比如 “测试覆盖率≥85%”“迭代次数≤3 次”，不能用 “写得好一点” 这种模糊的标准。

📋 五、实战：30 分钟给 Hermes 装上第一个生产级 Skill

新手入门，不用贪多，先把第一个 Skill——代码规范对齐 Skill装起来，30 分钟就能落地，立刻看到效果：

第一步：配置规范（5 分钟）把上面的 CodeStandardSkill 代码复制下来，修改里面的 tech_stack、code_rules，改成你 / 团队的技术栈和规范。
第二步：导入 Hermes（10 分钟）把 Skill 文件放到 Hermes 的 skills 目录下，在 Hermes 配置文件里注册这个 Skill，重启 Hermes 服务。
第三步：创建项目规范文件（5 分钟）在你的项目根目录创建 CLAUDE.md，把项目的技术栈、规范、禁止事项写进去，和 Skill 里的配置对齐。
第四步：测试验证（10 分钟）给 Hermes 发一个简单的需求，比如 “帮我写一个用户登录的 FastAPI 接口”，看它的输出是否符合你的规范，会不会自动做格式校验，有没有遵守禁止事项。
第五步：持续使用每次用的时候，它都会沉淀你的偏好，用得越多，输出越贴合你的习惯。

🎯 六、5 个 Skill 速查卡

表格

Skill 序号	Skill 名称	核心作用	落地时间	核心进化点
1	代码规范对齐 Skill	统一代码输出风格，贴合团队规范	30 分钟	越用越懂你的编码习惯
2	测试驱动闭环 Skill	构建质量闭环，保证代码生产就绪	1 小时	越写越稳，踩过的坑不再踩
3	上下文记忆沉淀 Skill	沉淀项目与个人经验，跨会话复用	2 小时	越用越懂你的项目和业务
4	多工具编排 Skill	拓展能力边界，自主完成复杂任务	半天	工具调用越来越精准，能力越来越全
5	自我迭代优化 Skill	自主复盘优化，实现自我进化	1 天	不用手动修改，自己越用越聪明

🔮 七、未来展望：Skill 之后，Hermes 的进化终点

2026 年，我们正处在 Agentic Engineering 的早期，Skill 只是 Hermes 进化的起点。未来 1-2 年，我们会看到三个明确的趋势：

Skill 市场标准化：会出现类似 App Store 的 Hermes Skill 市场，开发者可以分享、销售自己打磨的生产级 Skill，开箱即用。
Skill 跨平台互通：随着 MCP 协议成为事实标准，你打磨的 Skill，不仅能在 Hermes 里用，还能在 Claude Code、Cursor、Windsurf 里通用，一次编写，全平台复用。
全链路自主进化：Hermes 会从 “单 Skill 自我优化”，进化到 “全技能体系自主升级”，根据你的项目需求，自己创建新的 Skill，自己优化旧的 Skill，真正成为你的 “数字开发搭档”。

🎁 总结

最后回到开头的问题：为什么大佬的 Hermes 越用越聪明？不是因为他们的模型更好，也不是因为他们的 prompt 更长，而是因为他们给 Hermes 植入了可进化的 Skill 体系。Vibe Coding 时代，我们拼的是 “谁的 prompt 写得好”；Agentic Engineering 时代，我们拼的是 “谁的 Skill 体系设计得好”。这 5 个 Skill，从基础规范到自我迭代，覆盖了 Hermes 进化的全流程，复制即可落地。不用贪多，先把第一个规范对齐 Skill 用起来，你会立刻发现，你的 Hermes 和以前不一样了。

系列文章：