当前位置：首页 > news >正文

Get Shit Done：上下文工程如何重塑AI辅助开发的可靠性边界

news 2026/8/1 20:39:33

Get Shit Done：上下文工程如何重塑AI辅助开发的可靠性边界

【免费下载链接】get-shit-doneA light-weight and powerful meta-prompting, context engineering and spec-driven development system for Claude Code by TÂCHES.项目地址: https://gitcode.com/GitHub_Trending/getshi/get-shit-done

在AI编码工具普及的今天，开发者面临一个令人沮丧的现实：随着对话轮次增加，AI的代码质量显著衰退。上下文污染、记忆碎片化和规范漂移成为阻碍AI辅助开发走向生产级应用的核心障碍。Get Shit Done（GSD）通过创新的上下文工程技术，为这一难题提供了系统化解决方案，重新定义了AI编码的可靠性边界。

问题根源：AI编码的三重衰减效应

传统AI编码工具采用线性对话模式，这种设计存在固有的结构性缺陷。当开发者与AI进行多轮交互时，三个关键问题逐渐浮现：

上下文污染积累- 每个新的代码片段、每个错误修正、每个设计讨论都堆积在有限的上下文窗口中。就像在一张白纸上反复书写，早期的重要决策被后续的细节淹没，AI逐渐失去对项目整体架构的理解。

记忆碎片化- 重要的设计决策、技术约束和业务规则分散在数百条消息中。当AI需要回顾"为什么选择这个数据库架构"或"如何处理边界情况"时，它必须在混乱的对话历史中搜寻，常常遗漏关键信息。

规范漂移- 随着时间推移，代码风格、架构模式和实现策略逐渐偏离初始设计。缺乏持续的规范约束，导致项目结构松散，技术债务快速累积。

这些问题不是偶然的bug，而是线性对话模型的结构性限制。GSD的创始人认识到，要解决这些问题，需要从根本上重新思考AI与开发者的协作模式。

解法架构：四层上下文工程系统

GSD采用分层架构设计，将复杂的开发过程分解为可管理的上下文单元。每个层级都有明确的职责和清晰的边界，确保信息流动有序且高效。

第一层：项目上下文容器

GSD的核心创新是.planning/目录结构，这是一个专门设计的项目上下文容器。与传统聊天记录不同，这个容器采用结构化文档格式：

PROJECT.md- 项目愿景、核心价值和约束条件
REQUIREMENTS.md- 经过验证的功能需求列表
ROADMAP.md- 分阶段实施路线图
STATE.md- 实时项目状态和决策记录

这种设计确保每个文档都有单一职责，避免了信息混杂。当AI需要了解项目背景时，它读取的是经过整理和验证的信息，而不是原始的对话记录。

第二层：代理专业化分工

GSD将开发任务分解为多个专业代理，每个代理在干净的上下文中运行。这种分工模式模仿了高效开发团队的运作方式：

研究代理(agents/gsd-research-synthesizer.md) - 负责技术调研和可行性分析
规划代理(agents/gsd-planner.md) - 将需求转化为可执行的任务计划
执行代理(agents/gsd-executor.md) - 按照计划实施代码变更
验证代理(agents/gsd-verifier.md) - 确保代码质量和规范符合性

每个代理启动时都获得专门准备的上下文，避免了上下文污染。例如，执行代理只接收与当前任务相关的技术规范和约束，而不是整个项目历史。

第三层：原子化工作单元

GSD将开发过程分解为原子化的工作单元，每个单元都有明确的输入、处理和输出。这种设计基于一个关键洞察：AI在有限上下文中处理明确定义的小任务时表现最佳。

工作单元通过.planning/phases/目录组织，每个阶段包含：

CONTEXT.md- 阶段特定的设计决策和实施细节
PLAN.md文件- 原子化任务定义，每个任务都是独立的可提交单元
SUMMARY.md- 阶段成果总结和质量评估

原子化设计使得每个任务都可以独立验证和回滚，大大降低了错误传播的风险。

第四层：状态同步机制

GSD的状态管理系统 (get-shit-done/workflows/state-management.md) 确保所有代理对项目状态有一致的理解。这个系统维护着：

决策跟踪- 记录所有重要的技术决策及其理由
进度监控- 实时更新任务完成状态
依赖管理- 跟踪任务间的依赖关系，确保执行顺序正确

状态同步通过文件系统实现，这种设计既保证了持久性，又便于版本控制。每次状态变更都产生明确的记录，为问题追溯提供了完整的历史。

验证循环：质量保障的三重检查

GSD的质量保障不依赖于单一检查点，而是通过三重验证循环确保代码质量。这个循环贯穿整个开发过程，形成持续的质量反馈机制。

设计时验证：规范驱动开发

在编码开始之前，GSD通过规范驱动开发确保设计质量。commands/gsd/plan-phase.md命令触发规划代理，生成详细的实施规范：

技术调研- 研究代理分析技术栈选项和最佳实践
架构设计- 规划代理设计系统架构和组件边界
任务分解- 将复杂功能分解为可管理的原子任务
风险识别- 提前识别潜在的技术风险和缓解策略

这个过程确保每个实现决策都有充分的技术依据，避免了"边写边想"导致的架构混乱。

实施时验证：原子提交协议

GSD的执行代理 (agents/gsd-executor.md) 遵循严格的原子提交协议。每个任务完成后必须通过四个检查点：

代码完整性- 任务是否完整实现了预定功能
规范符合性- 代码是否符合项目规范和约束
测试覆盖- 是否包含必要的测试用例
文档更新- 相关文档是否同步更新

只有通过所有检查的任务才能提交到版本控制系统。这种协议确保了每个提交都是高质量、可维护的代码单元。

完成后验证：质量门控检查

阶段完成后，GSD通过commands/gsd/verify-work.md执行全面的质量门控检查。这个检查包括：

代码审查- 自动化的代码质量分析
功能验证- 确保实现满足所有需求
性能评估- 检查系统性能和资源使用
安全扫描- 识别潜在的安全漏洞

验证结果记录在.planning/phases/[phase-number]/SUMMARY.md中，为后续阶段提供质量基准。

实践应用：从概念到生产的完整流程

GSD的实际应用遵循一个精心设计的流程，将理论架构转化为具体的开发实践。这个流程已经在数百个项目中验证，证明了其可行性和有效性。

项目初始化：结构化需求收集

当开发者运行/gsd-new-project时，GSD启动一个结构化的需求收集过程。与传统AI对话不同，这个过程有明确的阶段和检查点：

用户访谈阶段- GSD通过有针对性的问题了解项目目标、用户群体和技术约束。这些问题基于get-shit-done/references/questioning.md中的最佳实践设计，确保收集的信息全面且相关。

并行研究阶段- 多个研究代理同时运行，分别调研技术栈、市场现状和潜在风险。这种并行设计大大缩短了研究时间，同时保证了信息的多样性。

需求提炼阶段- 研究结果被提炼为结构化的需求文档 (REQUIREMENTS.md)，每个需求都有明确的验收标准和优先级。

路线图规划阶段- 基于需求分析，GSD生成分阶段的实施路线图 (ROADMAP.md)，每个阶段都有明确的目标和交付物。

阶段执行：上下文保持的开发循环

每个开发阶段都遵循"讨论-规划-执行-验证"的循环，这个循环确保上下文在整个过程中保持一致：

讨论阶段(commands/gsd/discuss-phase.md) - 开发者与AI讨论实施细节，形成CONTEXT.md文档。这个文档记录了所有重要的设计决策和实施约束。

规划阶段(commands/gsd/plan-phase.md) - 规划代理基于上下文文档生成详细的实施计划，包括具体的任务分解和验收标准。

执行阶段(commands/gsd/execute-phase.md) - 执行代理按照计划实施代码变更，遵循原子提交协议，确保每个变更都是可验证的。

验证阶段(commands/gsd/verify-work.md) - 验证代理检查实施质量，确保代码符合所有规范和约束。

状态管理：持续的项目记忆

GSD的状态管理系统 (get-shit-done/bin/lib/state.cjs) 确保项目记忆在开发过程中持续保持。这个系统维护着：

会话状态- 当前开发会话的进度和上下文
历史记录- 所有已完成阶段的质量评估
决策日志- 重要的技术决策及其理由
依赖图谱- 任务和组件间的依赖关系

状态信息存储在.planning/STATE.md中，这个文件既是机器可读的数据源，也是人类可读的项目文档。

技术实现：文件系统的智能应用

GSD的技术实现基于一个核心洞察：文件系统是最可靠、最透明的状态管理机制。通过精心设计的目录结构和文件格式，GSD在简单性和功能性之间找到了最佳平衡点。

目录结构设计

.planning/目录的结构反映了GSD的架构理念：

.planning/ ├── PROJECT.md # 项目愿景和约束 ├── REQUIREMENTS.md # 功能需求列表 ├── ROADMAP.md # 阶段实施路线图 ├── STATE.md # 实时项目状态 ├── config.json # 工作流配置 ├── research/ # 技术调研文档 └── phases/ # 各阶段工作目录 └── 01-[phase-name]/ ├── CONTEXT.md # 阶段设计决策 ├── PLAN.md # 任务实施计划 └── SUMMARY.md # 阶段成果总结

这种结构使得每个文档都有明确的职责和位置，AI和开发者都能轻松找到所需信息。