当前位置：首页 > news >正文

【项目自荐】Agent System Prompt Architect v0.1：让 AI Agent 更稳定地编写系统提示词的 Skill

news 2026/7/18 1:31:44

Agent System Prompt Architect v0.1：让 AI Agent 更稳定地编写系统提示词的 Skill

GitHub：
https://github.com/CR-730/agent-system-prompt-architect-skill

项目简介

Agent System Prompt Architect 是一个面向 Codex / Claude Code 风格环境的 Skill，用于帮助 AI Agent 为其他 Agent 项目生成可部署的 System Prompt。

今天的新版本做了一轮比较大的整理：不仅补强了 Skill 本身，还补上了中文 README、安装说明、评估用例和自动化 eval runner。现

这次更新了什么

1. README 改成中文项目首页

新版 README 不再只是目录说明，而是更明确地说明：

- 这个 Skill 适合什么场景
- 它主要解决哪些 prompt 编写问题
- 如何安装和使用
- 有哪些核心能力
- 当前 eval 结果如何
- 为什么 Skill 正文仍然保持英文

Skill 本体和 reference 文件仍然保持英文，主要是为了让 Agent 在运行时更稳定地理解和执行；面向人的项目说明则改成中文，方便国内用户阅读。

2. 新增 Codex 安装说明

新增了：

.codex/INSTALL.md

里面包含：

- macOS / Linux 安装方式
- Windows PowerShell 安装方式
- clone + symlink / junction 的推荐安装方式
- 直接复制安装方式
- 验证、更新、卸载步骤

安装命令也做了防重复检查，避免用户重复执行时把目录套出多层或者误覆盖已有 Skill。

3. 新增自动化评估体系

这次补了 test/ 目录：

test/
evals.json
triggers.json
README.md

它主要评估两件事：

- 这个 Skill 会不会在正确场景被触发
- 使用 Skill 后，生成的 system prompt 质量是否真的比 baseline 更好

同时新增了 MIMO 兼容的 eval runner：

scripts/run_skill_evals.py

可以跑：

- 输出质量评估
- 触发评估
- with skill / without skill 对照
- 单 case 调试
- 多轮 iteration 归档

当前内部基准结果：

- 模型：mimo-v2.5-pro
- with skill 平均通过率：0.917
- without skill 平均通过率：0.554
- 触发评估：14 / 14 通过

解决的问题

让 AI 直接写 system prompt 时，常见问题包括：

- 根据项目名、品牌名乱推角色
- 把工具能力写成不存在的 API
- 把 schema 字段、class 名、上下游管线词直接塞进 prompt
- 生成过长、重复、不可部署的提示词
- 把经验偏好写成固定流程
- 缺少领域、工具、证据、输出格式和失败处理的判断标准
- 输出 system prompt 之前夹带“设计说明”“供你审阅”等非部署内容

核心设计

- 名称只作为标签，不直接作为角色
- 稳定事实和判断标准优先
- 工具能力和真实工具规格分离
- 没有真实 runtime spec 时不虚构 API
- 默认直接输出可部署 system prompt
- 领域适配使用 checklist，但不强行补全所有字段
- prompt 技术按需选择，而不是越复杂越好
- 写完初稿后用 evaluation 清单检查、压缩和修正
- README 和测试说明面向用户中文化，Skill 正文保持英文以利于 Agent 执行

目录结构

skills/agent-system-prompt-architect/
SKILL.md
agents/openai.yaml
references/

test/
evals.json
triggers.json
README.md

scripts/
run_skill_evals.py

.codex/
INSTALL.md

适合谁参考

如果你也在做：

- AI Agent
- Codex / Claude Code Skill
- system prompt 设计
- 多工具 Agent
- RAG / research / support / code agent
- prompt eval 和自动化评估

这个项目应该会有参考价值。

GitHub：
https://github.com/CR-730/agent-system-prompt-architect-skill

非常欢迎 star，也欢迎在 issues 里提建议。我会继续根据真实使用和 eval 结果迭代。

查看全文