当前位置: 首页 > news >正文

构建企业级 AI 编程助手(AI-OS)v1.0,集成 Matt Pocock 全套技能,实现零幻觉开发

告别单文件 Prompt:构建企业级 AI 编程助手(AI-OS)v1.0,集成 Matt Pocock 全套技能,实现零幻觉开发

引言:为什么你的 AI 编程总是“翻车”?

在使用 OpenCode、Cursor、Cline 等 AI 编程工具时,你是否遇到过以下痛点:

  1. 规范失效:明明在 Prompt 里写了“遵守 Clean Code”,AI 写到第 3 个文件就全忘了。
  2. 严重幻觉:AI 捏造不存在的 API,或者写完代码不跑测试就告诉你“搞定了”。
  3. 无法复用:每个新项目都要重新写一遍长长的 System Prompt,极其繁琐。
  4. 上下文爆炸:把所有规则塞进一个.md文件,导致 AI 注意力稀释,频繁出现“中间遗忘”。

破局之道:大模型工程化的核心,不是写一个“超级 Prompt”,而是构建一套AI 能理解、能执行、能自我校验的标准化操作系统(AI-OS)

本文将为你开源一套经过生产环境验证的AI-OS v1.0 架构。通过“分层路由 + 物理工具校验”,并深度集成 Matt Pocock 的 21 个全流程神级 Skills,让 AI 像运行程序一样严格执行开发任务,真正实现一次搭建,终身复用,零幻觉


一、 核心架构:从“单文件”到“分层路由洋葱模型”

我们将规则拆分为全局资产与项目资产,AI 在不同阶段只加载当前需要的层,确保注意力 100% 集中:

层级作用存储位置加载时机核心内容
L0 全局规范层所有项目通用的编码、Git、测试规范~/.ai-os/standards/编码/提交时按需注入Clean Code、Git 规范
L1 全局 SOP 层所有项目通用的标准化工作流~/.ai-os/sops/执行具体任务时调用TDD 流程、Bug 排查流程
L2 全局技能层Matt Pocock 21 Skills+ 自定义技能~/.ai-os/skills/触发@指令时调用需求拷问、架构优化、领域建模等
L3 项目路由层单个项目的“入口与大脑”./.ai/RULES.md项目打开时永久常驻路由协议、工具映射、XML 输出约束
L4 项目上下文层单个项目特有的业务信息./.ai/context/对应任务执行前按需加载PRD、领域模型、架构设计

核心突破:将通用资产和顶级开源 Skills 放入全局目录~/.ai-os/,新项目只需一个 800 字的RULES.md即可继承所有能力。


二、 第一步:全局环境一键初始化(只需执行一次)

打开你的终端,复制并运行以下 Bash 脚本。它将在 10 秒内为你搭建好全局的 AI-OS 资产库,并自动整合你本地的 Matt Pocock 21 个 Skills

#!/bin/bash# AI-OS v1.0 全局初始化脚本 - 终极落地版 (集成 Matt Pocock Skills)echo"🚀 开始初始化 AI-OS v1.0 全局环境..."# 1. 创建全局目录结构mkdir-p~/.ai-os/{standards,sops,skills,templates,stacks}# 2. 整合 Matt Pocock 的 21 个神级 Skillsecho"🔗 整合 Matt Pocock 21 Skills..."# 替换成你存放skill的目录MATT_SKILLS_DIR="/Users/litianyu/skills"if[-d"$MATT_SKILLS_DIR"];then# 将 skills 目录下的所有内容复制到全局 skills 目录cp-r"$MATT_SKILLS_DIR"/* ~/.ai-os/skills/2>/dev/nullecho"✅ Matt Pocock 21 Skills 已成功整合到 ~/.ai-os/skills/"elseecho"⚠️ 警告:未找到$MATT_SKILLS_DIR,请确认路径或手动复制 skills 到 ~/.ai-os/skills/"fi# 3. 生成核心 SOP (标准作业程序)cat<<'EOF'>~/.ai-os/sops/SOP_TDD.md# TDD 标准作业程序 v1.0 ## 强制执行步骤 1. 读取 PRD 和领域模型,提取所有测试场景(正常、异常、边界) 2. 编写第一个失败的单元测试 3. 【强制】调用终端工具运行测试,确认测试失败 4. 编写最小实现代码,只写让测试通过的最少代码 5. 【强制】调用终端工具运行测试,确认测试通过 6. 重构代码,优化可读性和性能 7. 【强制】调用终端工具运行所有测试,确认没有回归 8. 【强制】调用终端工具运行 lint 和类型检查 9. 只有当所有命令都返回 0 退出码时,才能结束任务 EOFcat<<'EOF'>~/.ai-os/sops/SOP_TRIAGE.md# Bug 排查标准作业程序 v1.0 ## 强制执行步骤 1. 读取错误日志,提取关键信息:错误类型、发生位置、堆栈信息 2. 调用终端工具 grep 相关代码,定位问题所在文件 3. 分析根因,列出可能的解决方案 4. 生成修复 Diff 5. 【强制】调用终端工具运行相关测试,确认修复有效 6. 【强制】调用终端工具运行所有测试,确认没有引入新的 Bug EOF# 4. 生成编码与 Git 规范cat<<'EOF'>~/.ai-os/standards/CLEAN_CODE.md# 清洁代码规范 v1.0 - 单个函数不超过 50 行,单个文件不超过 300 行 - 每个函数只做一件事,参数不超过 5 个 - 注释“为什么”,而不是“做什么” EOFcat<<'EOF'>~/.ai-os/standards/GIT_WORKFLOW.md# Git 工作流规范 v1.0 - 提交信息必须符合 Conventional Commits:type(scope): message - 类型:feat, fix, docs, style, refactor, test, chore EOF# 5. 生成项目级 MCP 模板与 .aiignorecat<<'EOF'>~/.ai-os/templates/mcp_template.json{ "mcpServers": { "filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "./"] }, "git": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-git"] }, "command": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-command", "--allow", "python,pytest,git,docker,ruff,mypy"] } } } EOFcat<<'EOF'>~/.ai-os/templates/.aiignorevenv/ __pycache__/ .pytest_cache/ .env *.log node_modules/ EOFecho"✅ AI-OS v1.0 全局初始化完成!"

三、 第二步:项目级一键创世(每个新项目执行)

新建你的项目目录,打开 OpenCode / Cursor / Cline,直接粘贴以下“创世 Prompt”(以 Python+FastAPI 为例):

# 角色与任务 你是顶级 AI 架构师,严格遵守工程规范,拒绝任何幻觉。请基于全局 AI-OS (~/.ai-os/) 初始化当前项目。 # 项目信息 - 项目名称:my-awesome-api - 技术栈:Python 3.11 + FastAPI + PostgreSQL + Redis - 项目描述:一个高并发的电商订单处理系统 # 执行步骤 1. 读取 ~/.ai-os/templates/.aiignore,写入当前目录的 .aiignore 2. 读取 ~/.ai-os/templates/mcp_template.json,写入当前目录的 .mcp.json 3. 创建 .ai/ 和 .ai/context/ 目录 4. 创建 .ai/RULES.md,内容必须严格如下: --- (RULES.md 内容开始) --- # 项目 AI 路由协议 v1.0 ## 核心原则 - 严谨务实,拒绝幻觉,不确定就说"我不确定" - 复杂逻辑使用 deepseek-v4-pro,简单任务使用 deepseek-v4-flash ## 资产路由 - 全局规范:~/.ai-os/standards/ - 全局 SOP:~/.ai-os/sops/ - 全局技能:~/.ai-os/skills/ (包含 Matt Pocock 21 Skills) - 项目上下文:.ai/context/ ## 物理工具映射(根据当前客户端自动适配) - 执行终端命令:execute_command / run_command / run_terminal - 读取文件:read_file - 写入/修改文件:write_to_file / apply_diff ## 【强制输出格式】(核心防幻觉机制) 所有回答必须严格按照以下 XML 格式输出,禁止自由发挥: <thinking> 1. 我当前的任务是什么? 2. 我需要读取哪些文件?(必须列出完整路径) 3. 我需要调用哪些终端工具进行物理校验? </thinking> <file-loading> - 已读取:.ai/RULES.md - 已读取:[其他相关文件路径] </file-loading> <plan> 1. 步骤 1 2. 步骤 2 </plan> <execution> 具体代码或输出内容 </execution> <verification> 1. 我是否运行了 ruff/mypy/pytest 进行物理校验? 2. 我是否遵守了所有编码规范? </verification> ## 强制执行规则 1. 代码生成后,必须自动运行 lint、typecheck 和 test 2. 只有所有命令都通过,才能结束任务 3. 每次修改必须使用 apply_diff 生成增量修改,禁止输出完整文件 ## 技能自动路由与调用协议 (Matt Pocock 21 Skills) 你已集成 Matt Pocock 的全流程神级技能库。**禁止被动等待用户输入 `@`**,你必须根据当前对话的上下文、开发阶段和任务意图,**自动识别并调用**对应的技能。 ### 1. 调用动作规范 当匹配到对应技能时,必须首先使用 `read_file` 工具读取 `~/.ai-os/skills/<技能名>/skill.md`(若目录结构不同则自适应查找同级 `.md`),读取后严格按照其内部的 Steps 和 Rules 执行。 ### 2. 全生命周期技能路由表 #### 阶段一:需求规划与对齐 (Requirements) - **触发场景**:刚提出新功能、需求模糊、需要宏观梳理、需输出标准文档。 - **自动路由**: - `grill-me`:需求模糊时,自动进行穷尽式追问,消除歧义。 - `zoom-out`:需求复杂时,跳出细节梳理整体架构上下文。 - `to-prd`:需求确认完毕,自动将对话转化为标准 PRD 文档。 #### 阶段二:领域建模与架构设计 (Design) - **触发场景**:项目初始化、定义业务模型、多人协作需统一术语、设计 API。 - **自动路由**: - `domain-model`:定义业务模型时,打磨术语一致性,生成 CONTEXT.md/ADR。 - `ubiquitous-language`:需要统一团队术语时,提取 DDD 统一语言术语表。 - `design-an-interface`:需要设计 API/功能接口时,生成多套设计方案供选择。 #### 阶段三:项目初始化与工程化 (Setup) - **触发场景**:新建项目、配置代码规范、初始化目录结构、配置 Git 防护。 - **自动路由**: - `setup-pre-commit`:配置 Husky 等代码预提交校验。 - `git-guardrails-claude-code`:配置 Git 防护,拦截 push/reset 等危险命令。 - `scaffold-exercises`:生成标准项目目录或习题目录结构。 #### 阶段四:开发实现与重构优化 (Development & Refactoring) - **触发场景**:编写新功能、代码混乱需优化、TS 类型优化、老代码重构。 - **自动路由**: - `tdd`:编写新功能时,强制执行“红-绿-重构”测试驱动开发。 - `improve-codebase-architecture`:代码可维护性差时,扫描并优化架构/模块化。 - `request-refactor-plan`:面对老代码,生成安全的增量重构计划。 - `migrate-to-shoehorn`:TS 项目中,优化类型断言代码。 - `edit-article`:编写或优化代码注释、说明文档时提升可读性。 #### 阶段五:测试与 Bug 排查 (Testing & Debugging) - **触发场景**:出现 Bug、需要定位缺陷、交互式排查、验证功能。 - **自动路由**: - `triage-issue`:出现 Bug 时,自动定位根因并生成修复方案。 - `qa`:发现问题需定位时,进行交互式 QA 并自动提交 Bug 工单。 #### 阶段六:任务协作与工单管理 (Management) - **触发场景**:需求拆分、分配任务、管理 GitHub Issue。 - **自动路由**: - `to-issues`:需求确认后,将 PRD 拆解为可执行的 GitHub Issue。 - `github-triage`:自动分类和处理 GitHub Issue。 #### 阶段七:全周期通用与系统配置 (General & System) - **触发场景**:需要极简回复、管理笔记、扩展能力、修改 AI 配置。 - **自动路由**: - `caveman`:用户要求精简回复或需节省 Token 时,开启超精简模式。 - `obsidian-vault`:需要记录开发笔记或查阅资料时管理 Obsidian。 - `write-a-skill`:遇到重复性新模式时,自定义创建新技能。 - `customize-opencode`:需要修改 OpenCode 自身配置/插件时调用。 ### 3. 路由执行约束 1. **意图识别优先**:每次接收到用户输入,必须在 `<thinking>` 标签中判断当前所属阶段,并匹配上述路由表。 2. **组合调用**:复杂任务可组合调用(如先 `grill-me` 追问,再 `to-prd` 输出文档),但必须按逻辑顺序分布执行。 3. **用户覆盖**:若用户显式输入 `@<技能名>`,则无视自动路由,直接调用指定技能。 ## 在 .ai/context/ 下创建 PRD.md、ARCHITECTURE.md、DOMAIN_MODEL.md 空模板 ## 完成后输出《项目初始化报告》,并提示我输入需求以填充 PRD

四、 日常开发工作流演示

初始化完成后,你的日常开发将变得极其丝滑且严谨:

场景 1:接需求(防需求遗漏)

@grill-me 帮我分析一个用户积分抵扣功能的需求。
AI 行为

  1. 自动读取~/.ai-os/skills/grill-me/下的技能文件。
  2. 按照 Matt Pocock 的穷尽追问逻辑,从边界条件、并发处理等维度疯狂追问你。
  3. 你回答后,AI 将结构化需求写入.ai/context/PRD.md

场景 2:写代码(物理防幻觉,核心!)

@tdd 根据 PRD,开发积分抵扣的核心逻辑。
AI 行为

  1. 读取PRD.md~/.ai-os/skills/tdd/下的技能文件。
  2. 输出<plan>,先写失败的测试用例。
  3. 关键动作:AI 写完实现代码后,自动调用终端工具执行pytestruff check
  4. 如果终端返回报错,AI 会自动读取报错信息,自我修正代码,直到终端输出全绿。

场景 3:查 Bug(防排查幻觉)

@triage-issue 抵扣接口报 500,日志是 [粘贴日志]。
AI 行为

  1. 读取~/.ai-os/skills/triage-issue/下的技能文件。
  2. 调用终端工具执行grep查日志,定位源码。
  3. 输出根因分析,生成修复 Diff,并自动跑测试验证修复。

五、 避坑与进阶指南(生产环境血泪总结)

  1. MCP 配置路径
    初期强烈建议使用项目级.mcp.json(放在项目根目录)。全局配置容易因工具版本更新导致路径变化而失效。
  2. 上下文污染防护
    项目变大后,AI 可能会把.ai/context/里的所有文件都塞进上下文。.aiignore是必须的,同时在RULES.md中已写明“每次任务最多读取 3 个上下文文件”,强制 AI 聚焦。
  3. 打破“只说不做”
    如果 AI 回复“我已运行测试”但实际上没跑,说明工具映射失败。请在RULES.md的“物理工具映射”中,核对并修改为你当前使用的 AI 客户端的真实 Tool Name。
  4. 版本控制
    .ai/目录和.mcp.json提交到 Git!这样你的团队克隆项目后,打开 AI 工具就能立即继承相同的规范和 SOP。

结语

这套AI-OS v1.0彻底抛弃了“靠提示词约束 AI”的幻想,转而使用“架构分层 + 物理工具校验 + 顶级开源 Skills”的工程化手段。

它不是一成不变的,随着你的使用,你可以将踩过的坑补充到~/.ai-os/standards/中,将新的最佳实践提炼到~/.ai-os/sops/中。你积累的每一行规范,都会成为你未来所有项目的护城河。

现在,复制脚本,开始构建你的 AI 研发操作系统吧!


(本文首发于 CSDN,作者:阿汤猫666,转载请注明出处。如果觉得有用,欢迎点赞收藏!)

http://www.jsqmd.com/news/859826/

相关文章:

  • Gitee Scan:关键领域软件工厂的安全检测能力分析
  • 2026,大模型应用的工程化分水岭:从会用到可运营的 Agentic 路线图
  • [QA]插件式测试用例生成工具:LLM Test Case Tool 的设计与实现
  • 揭秘阿盖洛印相在Midjourney V6中的真实触发逻辑:3步绕过默认渲染链,复刻1842年银盐质感(附prompt原子模块)
  • 微信好友关系检测完整指南:快速找出谁删了你
  • 如何去掉merge
  • Servlet 容器与过滤器 超详细讲解
  • 利用Taotoken模型广场为不同AI应用场景挑选最合适的模型
  • 2026中国AIGC产业峰会启幕,大咖共探AI Agent落地与大模型突破路径
  • 我从一个码农到技术总监的10年奋斗史
  • 不止于指路,智慧导览如何重构公共空间价值
  • Vue 常用组件库完全指南:PC端、移动端与可视化全场景覆盖
  • 知识竞赛实时排名算法:平分怎么处理?
  • 丹麦语语音合成总不“像真人”?揭秘ElevenLabs最新v3.2引擎中未公开的3个丹麦语重音标记开关,限前200名开发者速查
  • 被裁员后,我靠代码创业成功的故事
  • 【知识获取与分享社区项目 | 项目日记第 7 天】关注取关实现:following 主表 + Outbox 同事务
  • 历史遗留炮弹排查技术解析:广州红鹏JM1000方案
  • 站长日记:实测一款神仙工具,终于搞定了Bing和360的收录难题
  • Vue UI样式兼容性常见问题与解决方案
  • Nodejs后端服务接入Taotoken多模型API的实践教程
  • Turnitin AI 检测算法深度剖析与绕过技术可行性方案
  • 2605C++,C++继承类实现调试器
  • SleeperX:macOS系统级电源管理架构解析与深度集成方案
  • YOLOv8水稻病害识别检测系统(项目源码+YOLO数据集+模型权重+UI界面+python+深度学习+环境配置)
  • API调用延迟飙升300%?ElevenLabs潮州话合成性能瓶颈诊断,工程师连夜修复的4个关键配置
  • 存储巨头日赚近3亿,长鑫科技还要让A股等多久?
  • NOBOOK账号使用指南:付费后能否多人共用?
  • Wand-Enhancer终极指南:免费解锁WeMod专业版与远程控制功能
  • 数据主权驱动:即时通讯私有化成选型必选项
  • 大模型智能体 (LLM Agent) 从入门到实战:让大模型真正 “会做事“