当前位置: 首页 > news >正文

【项目自荐】Agent System Prompt Architect v0.1:让 AI Agent 更稳定地编写系统提示词的 Skill

Agent System Prompt Architect v0.1:让 AI Agent 更稳定地编写系统提示词的 Skill

GitHub:
https://github.com/CR-730/agent-system-prompt-architect-skill

项目简介

Agent System Prompt Architect 是一个面向 Codex / Claude Code 风格环境的 Skill,用于帮助 AI Agent 为其他 Agent 项目生成可部署的 System Prompt。

今天的新版本做了一轮比较大的整理:不仅补强了 Skill 本身,还补上了中文 README、安装说明、评估用例和自动化 eval runner。现

这次更新了什么

1. README 改成中文项目首页

新版 README 不再只是目录说明,而是更明确地说明:

- 这个 Skill 适合什么场景
- 它主要解决哪些 prompt 编写问题
- 如何安装和使用
- 有哪些核心能力
- 当前 eval 结果如何
- 为什么 Skill 正文仍然保持英文

Skill 本体和 reference 文件仍然保持英文,主要是为了让 Agent 在运行时更稳定地理解和执行;面向人的项目说明则改成中文,方便国内用户阅读。

2. 新增 Codex 安装说明

新增了:

.codex/INSTALL.md

里面包含:

- macOS / Linux 安装方式
- Windows PowerShell 安装方式
- clone + symlink / junction 的推荐安装方式
- 直接复制安装方式
- 验证、更新、卸载步骤

安装命令也做了防重复检查,避免用户重复执行时把目录套出多层或者误覆盖已有 Skill。

3. 新增自动化评估体系

这次补了 test/ 目录:

test/
evals.json
triggers.json
README.md

它主要评估两件事:

- 这个 Skill 会不会在正确场景被触发
- 使用 Skill 后,生成的 system prompt 质量是否真的比 baseline 更好

同时新增了 MIMO 兼容的 eval runner:

scripts/run_skill_evals.py

可以跑:

- 输出质量评估
- 触发评估
- with skill / without skill 对照
- 单 case 调试
- 多轮 iteration 归档

当前内部基准结果:

- 模型:mimo-v2.5-pro
- with skill 平均通过率:0.917
- without skill 平均通过率:0.554
- 触发评估:14 / 14 通过

解决的问题

让 AI 直接写 system prompt 时,常见问题包括:

- 根据项目名、品牌名乱推角色
- 把工具能力写成不存在的 API
- 把 schema 字段、class 名、上下游管线词直接塞进 prompt
- 生成过长、重复、不可部署的提示词
- 把经验偏好写成固定流程
- 缺少领域、工具、证据、输出格式和失败处理的判断标准
- 输出 system prompt 之前夹带“设计说明”“供你审阅”等非部署内容

核心设计

- 名称只作为标签,不直接作为角色
- 稳定事实和判断标准优先
- 工具能力和真实工具规格分离
- 没有真实 runtime spec 时不虚构 API
- 默认直接输出可部署 system prompt
- 领域适配使用 checklist,但不强行补全所有字段
- prompt 技术按需选择,而不是越复杂越好
- 写完初稿后用 evaluation 清单检查、压缩和修正
- README 和测试说明面向用户中文化,Skill 正文保持英文以利于 Agent 执行

目录结构

skills/agent-system-prompt-architect/
SKILL.md
agents/openai.yaml
references/

test/
evals.json
triggers.json
README.md

scripts/
run_skill_evals.py

.codex/
INSTALL.md

适合谁参考

如果你也在做:

- AI Agent
- Codex / Claude Code Skill
- system prompt 设计
- 多工具 Agent
- RAG / research / support / code agent
- prompt eval 和自动化评估

这个项目应该会有参考价值。

GitHub:
https://github.com/CR-730/agent-system-prompt-architect-skill

非常欢迎 star,也欢迎在 issues 里提建议。我会继续根据真实使用和 eval 结果迭代。

http://www.jsqmd.com/news/862906/

相关文章:

  • 网络延迟排查实战:从概念到工具,定位系统卡顿根因
  • 像素风机甲对战小游戏HTML
  • XUnity.AutoTranslator完全指南:5分钟掌握Unity游戏实时翻译技巧
  • 总结靠谱的高档办公室装修品牌企业,如何选择? - myqiye
  • 从二叉树到B+Tree理解MySQL索引底层原理
  • C语言表驱动编程:告别if-else,实现高效命令解析与状态机
  • 周村区哪家烧烤好吃?开荤烧烤:12 年匠心,地道烟火味
  • GraphRAG生态全景:6大主流方案盘点
  • 和你一起品味比较好的进口艺术涂料企业,哪家更靠谱 - myqiye
  • 谷歌SEO全面解析|新手入门 + 排名提升核心要点
  • SSH公钥登录实战:从原理到应急响应与权限维持
  • AI+生产制造,车间里正在发生什么?
  • GEO优化的两大误区:你是在“交学费”还是在“抢红利”?
  • 实时洞察,视觉赋能:国内情绪识别API公司推荐及计算机视觉流派深度解析
  • C语言驱动法编程:嵌入式开发中的硬件抽象与架构设计实践
  • 一个Token的昇腾之旅——从模型输入到硬件执行的完整链路
  • 【论文阅读】3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations
  • 【行业首发】Midjourney单色调风格私有Prompt架构(含12个已验证灰阶锚点词+3类禁用语义雷区)
  • 亲戚关系怎么叫?用 NAS 搭一个亲戚关系计算器,春节拜年不再尴尬
  • 解决Claude Code访问不稳定问题并配置Taotoken接入
  • 1分钟带你认识分辨率 帧率, 码率 HDR 的作用
  • go 语言中的context 解读和用法
  • (二) LLM探索能力-1. 大语言模型能够进行上下文探索吗?
  • 仅剩最后47个印尼语专属Voice ID配额!ElevenLabs企业版印尼语音定制通道即将关闭——附2024Q3合规接入白皮书
  • 【校企合作】陕科大镐京学院电信学院领导一行莅临华清远见西安中心参观交流
  • 一种三菱MXF100-8 走CC LINK IE TSN 网络控制单轴伺服的功能块(可控30+轴)
  • 2026 年 5 款热门配音 APP 深度对比:个人 / 商用 / 专属声线,哪款最适合你?
  • Adams 多体动力学:工业仿真的黄金标准与未来引擎
  • 工业 CAN 通信利器!六通道隔离集线器,中继滤波稳组网
  • 2026最新诚信优选 汉中市汉台区黄金回收白银回收铂金回收彩金回收门店TOP5排行榜+联系方式推荐_转自TXT - 盛世金银回收