构建企业级 AI 编程助手(AI-OS)v1.0,集成 Matt Pocock 全套技能,实现零幻觉开发
告别单文件 Prompt:构建企业级 AI 编程助手(AI-OS)v1.0,集成 Matt Pocock 全套技能,实现零幻觉开发
引言:为什么你的 AI 编程总是“翻车”?
在使用 OpenCode、Cursor、Cline 等 AI 编程工具时,你是否遇到过以下痛点:
- 规范失效:明明在 Prompt 里写了“遵守 Clean Code”,AI 写到第 3 个文件就全忘了。
- 严重幻觉:AI 捏造不存在的 API,或者写完代码不跑测试就告诉你“搞定了”。
- 无法复用:每个新项目都要重新写一遍长长的 System Prompt,极其繁琐。
- 上下文爆炸:把所有规则塞进一个
.md文件,导致 AI 注意力稀释,频繁出现“中间遗忘”。
破局之道:大模型工程化的核心,不是写一个“超级 Prompt”,而是构建一套AI 能理解、能执行、能自我校验的标准化操作系统(AI-OS)。
本文将为你开源一套经过生产环境验证的AI-OS v1.0 架构。通过“分层路由 + 物理工具校验”,并深度集成 Matt Pocock 的 21 个全流程神级 Skills,让 AI 像运行程序一样严格执行开发任务,真正实现一次搭建,终身复用,零幻觉。
一、 核心架构:从“单文件”到“分层路由洋葱模型”
我们将规则拆分为全局资产与项目资产,AI 在不同阶段只加载当前需要的层,确保注意力 100% 集中:
| 层级 | 作用 | 存储位置 | 加载时机 | 核心内容 |
|---|---|---|---|---|
| L0 全局规范层 | 所有项目通用的编码、Git、测试规范 | ~/.ai-os/standards/ | 编码/提交时按需注入 | Clean Code、Git 规范 |
| L1 全局 SOP 层 | 所有项目通用的标准化工作流 | ~/.ai-os/sops/ | 执行具体任务时调用 | TDD 流程、Bug 排查流程 |
| L2 全局技能层 | Matt Pocock 21 Skills+ 自定义技能 | ~/.ai-os/skills/ | 触发@指令时调用 | 需求拷问、架构优化、领域建模等 |
| L3 项目路由层 | 单个项目的“入口与大脑” | ./.ai/RULES.md | 项目打开时永久常驻 | 路由协议、工具映射、XML 输出约束 |
| L4 项目上下文层 | 单个项目特有的业务信息 | ./.ai/context/ | 对应任务执行前按需加载 | PRD、领域模型、架构设计 |
核心突破:将通用资产和顶级开源 Skills 放入全局目录~/.ai-os/,新项目只需一个 800 字的RULES.md即可继承所有能力。
二、 第一步:全局环境一键初始化(只需执行一次)
打开你的终端,复制并运行以下 Bash 脚本。它将在 10 秒内为你搭建好全局的 AI-OS 资产库,并自动整合你本地的 Matt Pocock 21 个 Skills。
#!/bin/bash# AI-OS v1.0 全局初始化脚本 - 终极落地版 (集成 Matt Pocock Skills)echo"🚀 开始初始化 AI-OS v1.0 全局环境..."# 1. 创建全局目录结构mkdir-p~/.ai-os/{standards,sops,skills,templates,stacks}# 2. 整合 Matt Pocock 的 21 个神级 Skillsecho"🔗 整合 Matt Pocock 21 Skills..."# 替换成你存放skill的目录MATT_SKILLS_DIR="/Users/litianyu/skills"if[-d"$MATT_SKILLS_DIR"];then# 将 skills 目录下的所有内容复制到全局 skills 目录cp-r"$MATT_SKILLS_DIR"/* ~/.ai-os/skills/2>/dev/nullecho"✅ Matt Pocock 21 Skills 已成功整合到 ~/.ai-os/skills/"elseecho"⚠️ 警告:未找到$MATT_SKILLS_DIR,请确认路径或手动复制 skills 到 ~/.ai-os/skills/"fi# 3. 生成核心 SOP (标准作业程序)cat<<'EOF'>~/.ai-os/sops/SOP_TDD.md# TDD 标准作业程序 v1.0 ## 强制执行步骤 1. 读取 PRD 和领域模型,提取所有测试场景(正常、异常、边界) 2. 编写第一个失败的单元测试 3. 【强制】调用终端工具运行测试,确认测试失败 4. 编写最小实现代码,只写让测试通过的最少代码 5. 【强制】调用终端工具运行测试,确认测试通过 6. 重构代码,优化可读性和性能 7. 【强制】调用终端工具运行所有测试,确认没有回归 8. 【强制】调用终端工具运行 lint 和类型检查 9. 只有当所有命令都返回 0 退出码时,才能结束任务 EOFcat<<'EOF'>~/.ai-os/sops/SOP_TRIAGE.md# Bug 排查标准作业程序 v1.0 ## 强制执行步骤 1. 读取错误日志,提取关键信息:错误类型、发生位置、堆栈信息 2. 调用终端工具 grep 相关代码,定位问题所在文件 3. 分析根因,列出可能的解决方案 4. 生成修复 Diff 5. 【强制】调用终端工具运行相关测试,确认修复有效 6. 【强制】调用终端工具运行所有测试,确认没有引入新的 Bug EOF# 4. 生成编码与 Git 规范cat<<'EOF'>~/.ai-os/standards/CLEAN_CODE.md# 清洁代码规范 v1.0 - 单个函数不超过 50 行,单个文件不超过 300 行 - 每个函数只做一件事,参数不超过 5 个 - 注释“为什么”,而不是“做什么” EOFcat<<'EOF'>~/.ai-os/standards/GIT_WORKFLOW.md# Git 工作流规范 v1.0 - 提交信息必须符合 Conventional Commits:type(scope): message - 类型:feat, fix, docs, style, refactor, test, chore EOF# 5. 生成项目级 MCP 模板与 .aiignorecat<<'EOF'>~/.ai-os/templates/mcp_template.json{ "mcpServers": { "filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "./"] }, "git": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-git"] }, "command": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-command", "--allow", "python,pytest,git,docker,ruff,mypy"] } } } EOFcat<<'EOF'>~/.ai-os/templates/.aiignorevenv/ __pycache__/ .pytest_cache/ .env *.log node_modules/ EOFecho"✅ AI-OS v1.0 全局初始化完成!"三、 第二步:项目级一键创世(每个新项目执行)
新建你的项目目录,打开 OpenCode / Cursor / Cline,直接粘贴以下“创世 Prompt”(以 Python+FastAPI 为例):
# 角色与任务 你是顶级 AI 架构师,严格遵守工程规范,拒绝任何幻觉。请基于全局 AI-OS (~/.ai-os/) 初始化当前项目。 # 项目信息 - 项目名称:my-awesome-api - 技术栈:Python 3.11 + FastAPI + PostgreSQL + Redis - 项目描述:一个高并发的电商订单处理系统 # 执行步骤 1. 读取 ~/.ai-os/templates/.aiignore,写入当前目录的 .aiignore 2. 读取 ~/.ai-os/templates/mcp_template.json,写入当前目录的 .mcp.json 3. 创建 .ai/ 和 .ai/context/ 目录 4. 创建 .ai/RULES.md,内容必须严格如下: --- (RULES.md 内容开始) --- # 项目 AI 路由协议 v1.0 ## 核心原则 - 严谨务实,拒绝幻觉,不确定就说"我不确定" - 复杂逻辑使用 deepseek-v4-pro,简单任务使用 deepseek-v4-flash ## 资产路由 - 全局规范:~/.ai-os/standards/ - 全局 SOP:~/.ai-os/sops/ - 全局技能:~/.ai-os/skills/ (包含 Matt Pocock 21 Skills) - 项目上下文:.ai/context/ ## 物理工具映射(根据当前客户端自动适配) - 执行终端命令:execute_command / run_command / run_terminal - 读取文件:read_file - 写入/修改文件:write_to_file / apply_diff ## 【强制输出格式】(核心防幻觉机制) 所有回答必须严格按照以下 XML 格式输出,禁止自由发挥: <thinking> 1. 我当前的任务是什么? 2. 我需要读取哪些文件?(必须列出完整路径) 3. 我需要调用哪些终端工具进行物理校验? </thinking> <file-loading> - 已读取:.ai/RULES.md - 已读取:[其他相关文件路径] </file-loading> <plan> 1. 步骤 1 2. 步骤 2 </plan> <execution> 具体代码或输出内容 </execution> <verification> 1. 我是否运行了 ruff/mypy/pytest 进行物理校验? 2. 我是否遵守了所有编码规范? </verification> ## 强制执行规则 1. 代码生成后,必须自动运行 lint、typecheck 和 test 2. 只有所有命令都通过,才能结束任务 3. 每次修改必须使用 apply_diff 生成增量修改,禁止输出完整文件 ## 技能自动路由与调用协议 (Matt Pocock 21 Skills) 你已集成 Matt Pocock 的全流程神级技能库。**禁止被动等待用户输入 `@`**,你必须根据当前对话的上下文、开发阶段和任务意图,**自动识别并调用**对应的技能。 ### 1. 调用动作规范 当匹配到对应技能时,必须首先使用 `read_file` 工具读取 `~/.ai-os/skills/<技能名>/skill.md`(若目录结构不同则自适应查找同级 `.md`),读取后严格按照其内部的 Steps 和 Rules 执行。 ### 2. 全生命周期技能路由表 #### 阶段一:需求规划与对齐 (Requirements) - **触发场景**:刚提出新功能、需求模糊、需要宏观梳理、需输出标准文档。 - **自动路由**: - `grill-me`:需求模糊时,自动进行穷尽式追问,消除歧义。 - `zoom-out`:需求复杂时,跳出细节梳理整体架构上下文。 - `to-prd`:需求确认完毕,自动将对话转化为标准 PRD 文档。 #### 阶段二:领域建模与架构设计 (Design) - **触发场景**:项目初始化、定义业务模型、多人协作需统一术语、设计 API。 - **自动路由**: - `domain-model`:定义业务模型时,打磨术语一致性,生成 CONTEXT.md/ADR。 - `ubiquitous-language`:需要统一团队术语时,提取 DDD 统一语言术语表。 - `design-an-interface`:需要设计 API/功能接口时,生成多套设计方案供选择。 #### 阶段三:项目初始化与工程化 (Setup) - **触发场景**:新建项目、配置代码规范、初始化目录结构、配置 Git 防护。 - **自动路由**: - `setup-pre-commit`:配置 Husky 等代码预提交校验。 - `git-guardrails-claude-code`:配置 Git 防护,拦截 push/reset 等危险命令。 - `scaffold-exercises`:生成标准项目目录或习题目录结构。 #### 阶段四:开发实现与重构优化 (Development & Refactoring) - **触发场景**:编写新功能、代码混乱需优化、TS 类型优化、老代码重构。 - **自动路由**: - `tdd`:编写新功能时,强制执行“红-绿-重构”测试驱动开发。 - `improve-codebase-architecture`:代码可维护性差时,扫描并优化架构/模块化。 - `request-refactor-plan`:面对老代码,生成安全的增量重构计划。 - `migrate-to-shoehorn`:TS 项目中,优化类型断言代码。 - `edit-article`:编写或优化代码注释、说明文档时提升可读性。 #### 阶段五:测试与 Bug 排查 (Testing & Debugging) - **触发场景**:出现 Bug、需要定位缺陷、交互式排查、验证功能。 - **自动路由**: - `triage-issue`:出现 Bug 时,自动定位根因并生成修复方案。 - `qa`:发现问题需定位时,进行交互式 QA 并自动提交 Bug 工单。 #### 阶段六:任务协作与工单管理 (Management) - **触发场景**:需求拆分、分配任务、管理 GitHub Issue。 - **自动路由**: - `to-issues`:需求确认后,将 PRD 拆解为可执行的 GitHub Issue。 - `github-triage`:自动分类和处理 GitHub Issue。 #### 阶段七:全周期通用与系统配置 (General & System) - **触发场景**:需要极简回复、管理笔记、扩展能力、修改 AI 配置。 - **自动路由**: - `caveman`:用户要求精简回复或需节省 Token 时,开启超精简模式。 - `obsidian-vault`:需要记录开发笔记或查阅资料时管理 Obsidian。 - `write-a-skill`:遇到重复性新模式时,自定义创建新技能。 - `customize-opencode`:需要修改 OpenCode 自身配置/插件时调用。 ### 3. 路由执行约束 1. **意图识别优先**:每次接收到用户输入,必须在 `<thinking>` 标签中判断当前所属阶段,并匹配上述路由表。 2. **组合调用**:复杂任务可组合调用(如先 `grill-me` 追问,再 `to-prd` 输出文档),但必须按逻辑顺序分布执行。 3. **用户覆盖**:若用户显式输入 `@<技能名>`,则无视自动路由,直接调用指定技能。 ## 在 .ai/context/ 下创建 PRD.md、ARCHITECTURE.md、DOMAIN_MODEL.md 空模板 ## 完成后输出《项目初始化报告》,并提示我输入需求以填充 PRD四、 日常开发工作流演示
初始化完成后,你的日常开发将变得极其丝滑且严谨:
场景 1:接需求(防需求遗漏)
你:@grill-me 帮我分析一个用户积分抵扣功能的需求。
AI 行为:
- 自动读取
~/.ai-os/skills/grill-me/下的技能文件。 - 按照 Matt Pocock 的穷尽追问逻辑,从边界条件、并发处理等维度疯狂追问你。
- 你回答后,AI 将结构化需求写入
.ai/context/PRD.md。
场景 2:写代码(物理防幻觉,核心!)
你:@tdd 根据 PRD,开发积分抵扣的核心逻辑。
AI 行为:
- 读取
PRD.md和~/.ai-os/skills/tdd/下的技能文件。 - 输出
<plan>,先写失败的测试用例。 - 关键动作:AI 写完实现代码后,自动调用终端工具执行
pytest和ruff check。 - 如果终端返回报错,AI 会自动读取报错信息,自我修正代码,直到终端输出全绿。
场景 3:查 Bug(防排查幻觉)
你:@triage-issue 抵扣接口报 500,日志是 [粘贴日志]。
AI 行为:
- 读取
~/.ai-os/skills/triage-issue/下的技能文件。 - 调用终端工具执行
grep查日志,定位源码。 - 输出根因分析,生成修复 Diff,并自动跑测试验证修复。
五、 避坑与进阶指南(生产环境血泪总结)
- MCP 配置路径:
初期强烈建议使用项目级.mcp.json(放在项目根目录)。全局配置容易因工具版本更新导致路径变化而失效。 - 上下文污染防护:
项目变大后,AI 可能会把.ai/context/里的所有文件都塞进上下文。.aiignore是必须的,同时在RULES.md中已写明“每次任务最多读取 3 个上下文文件”,强制 AI 聚焦。 - 打破“只说不做”:
如果 AI 回复“我已运行测试”但实际上没跑,说明工具映射失败。请在RULES.md的“物理工具映射”中,核对并修改为你当前使用的 AI 客户端的真实 Tool Name。 - 版本控制:
将.ai/目录和.mcp.json提交到 Git!这样你的团队克隆项目后,打开 AI 工具就能立即继承相同的规范和 SOP。
结语
这套AI-OS v1.0彻底抛弃了“靠提示词约束 AI”的幻想,转而使用“架构分层 + 物理工具校验 + 顶级开源 Skills”的工程化手段。
它不是一成不变的,随着你的使用,你可以将踩过的坑补充到~/.ai-os/standards/中,将新的最佳实践提炼到~/.ai-os/sops/中。你积累的每一行规范,都会成为你未来所有项目的护城河。
现在,复制脚本,开始构建你的 AI 研发操作系统吧!
(本文首发于 CSDN,作者:阿汤猫666,转载请注明出处。如果觉得有用,欢迎点赞收藏!)
