当前位置：首页 > news >正文

告别AI失忆：用Agentic Code框架打造稳定高效的AI编程协作

news 2026/5/14 20:00:40

1. 项目概述：告别“AI失忆”，让智能体像资深开发者一样工作

如果你和我一样，在过去一年里深度使用过 Cursor、Codex 或 GitHub Copilot 这类 AI 编程工具，那你一定经历过这种“血压升高”的时刻：你花了半小时，通过十几轮对话，好不容易让 AI 理解了你的项目架构、代码规范和业务逻辑，结果在添加一个新功能时，它转头就把你刚写好的测试文件给删了，或者完全无视你之前定下的设计模式，开始“放飞自我”地写代码。这种“AI失忆症”和“上下文漂移”问题，几乎是所有现有工具的顽疾。

这就是agentic-code要解决的核心痛点。它不是一个全新的 AI 工具，而是一个基于AGENTS.md开放标准的工作流框架。你可以把它理解为你项目里的“首席技术官”或“资深架构师”角色说明书。它通过一套结构化的任务定义、工作流程和质量标准文件（统称为AGENTS.md），告诉 AI 智能体：“在我们这个项目里，应该怎么做事”。从需求分析、架构设计，到测试先行、代码审查，每一步都有章可循。AI 不再是那个需要你手把手教、还经常忘事的“实习生”，而是变成了一个遵循成熟工程实践的“靠谱同事”。

我花了几天时间，在一个真实的 TypeScript 后端项目里深度集成了agentic-code。最直观的感受是，沟通成本断崖式下降。以前我需要反复强调“记得写测试”、“遵循我们的目录结构”，现在只需要说一句“给用户模块加个分页查询接口”，AI 就会自动触发一整套流程：先分析现有代码和需求，然后生成设计文档概要让我确认，接着创建测试骨架，最后才去实现代码，并确保所有测试通过。整个过程有条不紊，产出质量稳定得让人惊讶。

2. 核心理念与架构拆解：任务、工作流与技能的三角支撑

agentic-code的威力来自于其清晰的三层架构：任务（Tasks）、工作流（Workflows）和技能（Skills）。这三者共同构成了 AI 智能体在你项目中的“操作手册”。

2.1 任务层：定义“要做什么”

任务层是 AI 的“待办事项清单”，位于.agents/tasks/目录下。每个任务都是一个 Markdown 文件，用自然语言清晰地描述了 AI 需要完成的一项具体工作及其步骤。例如，task-analysis.md是入口任务，AI 接到任何新指令时，都会先执行它来分析需求。

关键设计：原子性与引导性。每个任务都被设计得尽可能原子化。比如，“实现用户登录功能”会被拆解成“分析认证需求”、“设计认证架构”、“编写认证测试”、“实现认证逻辑”等一系列子任务。更重要的是，任务描述不仅仅是步骤列表，它包含了大量的“引导性提示”。它会告诉 AI：“在开始写代码前，请先浏览src/auth/目录下的现有模式”，或者“实现完成后，请运行npm test -- auth来验证”。这种引导确保了 AI 的行动始终贴合项目上下文。

2.2 工作流层：定义“按什么顺序做”

工作流层（.agents/workflows/）定义了任务的执行顺序和触发条件。它回答了“在什么情况下，应该走哪条路”的问题。这是实现“智能缩放”的关键。

简单任务 vs. 复杂功能：

简单任务（如修个Bug、加个工具函数）：走“快速通道”。AI 分析后认为改动范围小，会直接加载direct-execution工作流，跳过设计评审等环节，快速编码并验证。
复杂功能（如新建一个微服务、重构核心模块）：走“标准流程”。触发full-development工作流，依次执行需求分析、设计文档撰写（需要人工评审）、测试驱动开发、实现、集成测试等完整阶段。

这种动态的路由能力，让 AI 既能处理“五分钟搞定”的小需求，也能驾驭需要周密规划的大项目，避免了“杀鸡用牛刀”或“小马拉大车”的尴尬。

2.3 技能层：定义“做到什么标准”

技能层（.agents/skills/）是质量守门员，它定义了代码、文档、测试等产出的具体标准。这些技能文件遵循 OpenAI Codex 的 Skills 格式，可以被兼容的 AI 工具直接识别和应用。

技能是如何工作的？举个例子，项目中有一个skill-typescript-best-practices.md的技能文件。当 AI 开始编写 TypeScript 代码时，这个技能会被激活。它会提醒 AI：“请使用严格的interface而非type来定义对象结构（除非需要联合类型）”、“异步函数必须使用try/catch进行错误处理，并抛出定义好的业务异常类”。AI 在编码时会主动遵循这些规则，就像一个有经验的开发者被“赋能”了项目组的编码规范一样。

技能的可组合性：技能可以按需加载。一个“编写 REST API 端点”的任务，可能会同时加载“TypeScript 最佳实践”、“Express.js 框架规范”和“API 文档生成（Swagger）”等多个技能，确保最终产出的代码在风格、功能和可维护性上都符合要求。

3. 从零开始：在现有项目中集成 Agentic Code

理论讲完了，我们来点实际的。假设你有一个正在进行的 Node.js + TypeScript 项目，想引入agentic-code来提升 AI 协作效率。以下是详细步骤和避坑指南。

3.1 基础框架安装与初始化

首先，进入你的项目根目录。最快捷的方式是使用npx：

# 在项目根目录执行 npx agentic-code .

这条命令会在当前目录下创建两个核心文件/文件夹：

AGENTS.md：项目的“总纲”，AI 智能体进入项目后首先阅读的文件。它简要介绍了本项目使用的 Agentic Code 框架，并指向.agents目录。
.agents/：包含所有任务、工作流和技能定义的目录。

注意：如果你的项目根目录已存在AGENTS.md或.agents文件夹，该命令会提示你是否覆盖。对于已有项目，建议先备份，或者手动合并其中对你有用的部分。一个更安全的方法是先克隆框架仓库，再手动复制所需文件：
git clone https://github.com/shinpr/agentic-code.git /tmp/agentic-code cp /tmp/agentic-code/AGENTS.md . cp -r /tmp/agentic-code/.agents .

3.2 为你的 AI 工具安装技能

框架自带了许多通用技能，但需要“安装”到你的 AI 工具中，才能被其识别和调用。这里以最常用的Cursor和Codex CLI为例。

为 Cursor 安装技能：Cursor 的技能系统是其强大之处。安装后，这些技能会成为 Cursor 的“内置知识”，在编码时自动生效。

# 安装到用户全局范围（对所有项目生效） npx agentic-code skills --cursor # 技能会被安装到 ~/.cursor/skills/agentic-code/ # 或者，安装到当前项目范围（仅本项目生效） npx agentic-code skills --cursor --project # 技能会被安装到 ./.cursor/skills/agentic-code/

重要提示：Cursor 的技能功能可能需要切换到 Nightly 版本才能完全支持。安装后，重启 Cursor，你会发现在编写代码时，AI 的建议会更加贴合框架定义的规范。

为 Codex CLI 安装技能：如果你使用 OpenAI 的 Codex CLI，安装方式类似：

# 用户全局安装 npx agentic-code skills --codex # 项目局部安装 npx agentic-code skills --codex --project

3.3 定制化你的工作流（关键步骤）

默认的框架是通用的，但真正的威力在于定制。你需要根据自己项目的技术栈和团队规范来调整.agents/下的内容。

1. 调整任务定义：打开.agents/tasks/下的文件，例如implementation.md。你可能会看到一些通用的步骤，如“编写业务逻辑”。你需要将其具体化。例如，对于你的 Express.js 项目，可以修改为：

## 步骤 3：实现控制器逻辑 - 在 `src/controllers/` 下创建或修改对应的控制器文件。 - 遵循 `src/common/response-wrapper.ts` 中的格式封装响应。 - 所有业务错误必须使用 `src/common/errors/business-error.ts` 中定义的异常类抛出。 - 控制器方法应为 `async` 函数，并使用 `try/catch` 块。

这样，AI 在实现时就有了非常具体的指引。

2. 补充技能文件：查看.agents/skills/references/目录，框架可能已经提供了一些通用技能（如clean-code.md）。你需要为你的技术栈添加专属技能。例如，创建一个skill-express-ts.md：

# Express.js with TypeScript 技能 当开发 Express.js 应用时，请遵循以下规范： 1. **路由定义**：使用 `src/routes/v1/` 下的路由文件，并通过 `src/app.ts` 统一注册。 2. **中间件**：自定义中间件应放在 `src/middlewares/` 目录，并导出为函数。 3. **依赖注入**：服务层（Service）的实例应在 `src/services/index.ts` 中统一创建并注入控制器。 4. **配置管理**：使用 `config` 包从 `config/default.ts` 读取配置，切勿硬编码。

将这个文件放在.agents/skills/目录下，并在相关的任务文件中通过注释或指令引用它。

3. 配置质量门禁：在.agents/workflows/full-development.md中，你可以看到类似“质量门禁”的检查点。确保这些检查点与你的项目工具链匹配。例如，将“运行测试”的具体命令从通用的npm test改为你实际使用的npm run test:cov（运行测试并检查覆盖率）。

4. 实战演练：使用 Agentic Code 开发一个用户搜索 API

让我们通过一个完整的例子，看看 AI 在agentic-code框架下如何协作。假设我们要在已有的用户管理系统中，增加一个“根据用户名和状态筛选用户”的 API 端点。

第一步：向 AI 下达指令在 Cursor 的 Chat 界面或 Codex CLI 中，你只需要用自然语言描述需求：

“请添加一个用户搜索 API 端点，支持通过用户名（模糊匹配）和用户状态（精确匹配）进行筛选，需要分页。”

第二步：AI 自动执行任务分析AI 会首先读取AGENTS.md，然后进入.agents/tasks/task-analysis.md流程。它会：

理解你的自然语言需求。
扫描项目代码（如src/models/user.ts,src/routes/v1/user.ts），理解现有的数据模型和 API 结构。
评估这是一个“中等复杂度”的任务（涉及控制器、服务、可能还有仓库层的改动），因此决定触发full-development工作流。

第三步：生成设计文档并等待确认AI 会接着执行design.md任务，生成一个简要的设计文档，可能放在docs/design/adr-user-search-20240415.md。文档会包含：

API 定义：GET /api/v1/users/search?username=xxx&status=active&page=1&limit=20
影响模块：需要修改UserController、UserService、UserRepository。
数据库查询：在UserRepository中添加一个带动态WHERE条件的查询方法。它会将这份文档概要呈现给你，并询问：“这是基于现有架构的设计，是否批准？” 你确认后，它才会继续。

第四步：测试驱动开发批准后，AI 进入test-first-development.md任务。它会：

在tests/controllers/user.controller.test.ts中，新增针对searchUsers方法的测试用例，包括成功场景、参数缺失、无效状态等。
在tests/services/user.service.test.ts中，新增服务层测试，并模拟（mock）仓库层的调用。
此时，这些测试运行肯定会失败，因为实现代码还不存在。这正是 TDD 的“红灯”阶段。

第五步：实现代码接着，AI 执行implementation.md任务。它会：

在src/controllers/user.controller.ts中添加searchUsers方法，处理请求参数验证（可能会调用一个验证中间件技能）。
在src/services/user.service.ts中添加searchUsers业务逻辑方法，调用仓库层。
在src/repositories/user.repository.ts中添加findByCriteria方法，使用查询构建器动态组装 SQL。在整个编码过程中，之前安装的“TypeScript 最佳实践”、“Express.js 规范”等技能会持续生效，确保代码风格一致。

第六步：验证与提交最后，AI 执行verification.md任务：

运行你刚才写的所有新测试（以及相关模块的现有测试），确保全部通过（“绿灯”阶段）。
可能还会运行一次npm run lint来检查代码风格。
如果都通过，AI 会建议一个符合“1-Commit Principle”的提交信息，例如：feat(user): add search API with username and status filter。

至此，一个功能完整、经过测试、符合规范的 API 端点就开发完成了。你全程只下达了一个初始指令，并在设计阶段点了一次确认。

5. 高级技巧与疑难排坑

在实际使用中，你可能会遇到一些挑战。以下是我踩过坑后总结的经验。

5.1 如何让 AI 更好地理解现有项目上下文？

问题：AI 在分析任务时，对项目特有的“潜规则”（如自研的工具库、特殊的目录约定）理解不足。解决方案：强化“项目导览”技能。

在.agents/skills/下创建一个skill-project-context.md文件。
用清晰的结构介绍项目：核心技术栈、核心目录说明（如src/common/里放了什么）、特有的设计模式（如所有的 DTO 都在src/dtos/下）、以及任何“坑”（如“数据库连接必须通过getDbConnection()这个单例获取”）。
在task-analysis.md的最开始，加入指令：“在开始任何任务前，请务必阅读并应用skill-project-context.md中的知识。”

5.2 处理 AI 的“过度设计”或“设计不足”

问题：有时 AI 会对一个简单功能生成过于复杂的设计，或者相反，低估了任务的复杂度。解决方案：精细化你的工作流路由逻辑。

编辑.agents/workflows/下的文件，明确任务复杂度的判断标准。例如，在workflow-router.md中，你可以定义：
- 简单任务：仅修改 1 个现有文件，且不涉及外部依赖变更。
- 中等任务：修改 2-3 个文件，或新增 1 个简单文件。
- 复杂任务：涉及 3 个以上文件、新增数据库表、或修改核心接口。
让 AI 在分析任务后，根据这个标准自行选择路径，并在报告中说明理由，方便你复核。

5.3 代码审查的“第二双眼睛”问题

问题：让同一个 AI 会话在生成代码后立即进行自我审查，效果往往很差，因为它无法摆脱生成代码时的思维定势。解决方案：强制实施“隔离审查”。这是agentic-code文档中强调的最佳实践，我必须再强调一次：永远在新的会话中审查 AI 生成的输出。

手动方式：完成一个功能后，关闭当前 Cursor Chat 或 Codex 会话。新开一个，然后输入：“请以代码审查员的身份，审查src/features/user-search/下的所有代码，对照设计文档docs/design/user-search.md，检查其合规性、错误处理和测试覆盖率。”
自动化助手（Cursor 用户）：利用 MCP 服务器实现子代理审查。如文档所述，配置sub-agents-mcp后，你可以在一个会话内，将审查任务派发给一个独立的、上下文隔离的“审查代理”，这等效于开启新会话，但体验更流畅。

5.4 技能冲突与优先级

问题：当多个技能对同一件事有不同要求时（例如，一个技能要求用interface，另一个项目历史代码大量使用type），AI 会困惑。解决方案：建立清晰的技能优先级和例外规则。

在AGENTS.md或主要的技能文件中声明优先级：“本项目优先遵循skill-project-convention.md中的规则，它与通用技能冲突时，以本项目规则为准。”
对于历史遗留问题，使用“例外说明”。例如，在skill-project-convention.md中写明：“尽管我们推荐使用interface，但在src/legacy/目录下的文件，为保持一致性，请继续沿用原有的type定义方式。”

5.5 与现有 CI/CD 流程集成

问题：AI 生成的代码如何融入团队的 Git 工作流和 CI 管道？解决方案：将 Agentic Code 的检查点作为 CI 的预检查步骤。

你可以在.agents/workflows/verification.md中，加入运行 CI 前置检查的命令，例如npm run ci:precheck（这个脚本可以集成 lint、单元测试、类型检查）。
在项目的.git/hooks/pre-commit或 GitHub Actions 的 CI 配置中，可以加入一个步骤，检查本次提交是否涉及 AI 生成的大块代码，并自动建议运行某个审查任务。
更重要的是，培养团队习惯：将 AI 生成的设计文档（.agents/tasks/下或docs/design/下的文件）也纳入版本管理，作为代码变更的“需求说明书”，便于后续追溯。

6. 个人使用体会与未来展望

使用agentic-code几周后，我的最大感受是“可控性”和“可预测性”得到了质的提升。AI 从一种时而惊艳、时而恼人的“随机性助手”，变成了一个产出稳定、流程规范的“自动化开发流水线”。它尤其擅长处理那些模式固定、但细节繁琐的增删改查和模块初始化工作，把我从大量的重复劳动中解放出来，让我能更专注于真正的架构设计和复杂逻辑。

它并非银弹。对于极度创新、缺乏先例的算法问题，或者需要深度业务领域知识才能做出的权衡决策，AI 在框架内依然会显得力不从心，这时就需要我深度介入。框架的价值在于，它把这些需要人类智慧介入的“决策点”（如设计评审）明确地标识了出来，并通过流程强制暂停，等待我的输入，而不是自作主张地跑偏。

在我看来，agentic-code和AGENTS.md标准代表了一个重要的方向：将软件工程的最佳实践“编码”成机器可读、可执行的规范。这不仅仅是提升今天的 AI 编程工具的效率，更是为未来更自主的 AI 智能体奠定基础。我建议任何严肃使用 AI 编程的团队或开发者，都花点时间尝试一下这个框架。初期投入的定制化成本，会在后续无数次的“放心交付”中赚回来。你可以从一个最常用、最痛点的场景（比如“每次都要教 AI 怎么在我们项目里写 API”）开始，定制一个专属的工作流和技能，先小范围跑通，感受其威力，再逐步推广到整个项目。

查看全文

http://www.jsqmd.com/news/817226/