当前位置: 首页 > news >正文

AI 已经会写代码了,但它还不太会“交付”

────────

孤松AI记 · 工具观察

Loom 这个项目有意思的地方,不是又做了一个 coding agent,而是试图给 Codex、Claude Code、opencode 这些工具外面套一层交付流程:规划、验证、修复、预览、交接,都要留下证据。

近年用 AI 写代码,最容易产生一种错觉:

好像软件开发已经被解决了。

你给它一句需求,它能写页面、补接口、改样式、加测试。几分钟后,一个 demo 跑起来。那一刻确实挺爽。

但真正麻烦的地方,通常从 demo 之后才开始。

需求有没有被完整实现?

中间改过几轮,原始目标还在不在?

测试是真测过,还是 AI 自己觉得差不多?

浏览器预览有没有证据?

会话一压缩、工具一切换,它还能接着干吗?

这些问题,比"AI 会不会写代码"更现实。

01Loom 切的是什么问题

最近看到一个开源项目:Loom。

它自己的说法是,给现有 coding agent 做一个 open delivery harness。说白了,它不是替代 Codex、Claude Code、opencode,而是给这些 agent 加一层交付流程。

它支持的方向也很明确:把一次开发任务变成规划、实现、验证、修复、预览、交接这一整套循环。

怎么使用?

你不用换掉手上的工具——在 Codex 里本来你打"写个访客登记系统",现在在前面加个@loom就行(Claude Code、opencode 里是/loom),它就从"随手生成"切换成"结构化交付"。

接管之后,它不再一次性把代码吐给你,而是先规划,再一个个任务往下做。想从上次的状态接着干,一句@loom continue;想让它自查一遍,一句@loom review

02真正容易失控的地方

过去我们聊 AI 编程,注意力大多放在模型上:哪个模型代码能力更强,哪个 agent 更会改项目,哪个 IDE 体验更顺。

但真实项目里,模型只是一部分。

长任务真正容易崩的地方,是流程失控

比如做到一半就宣布完成。

比如上下文压缩之后,忘了前面确认过的边界。

比如修了 A,又把 B 搞坏了。

比如明明还有失败日志,却给你一个"已完成"的总结。

Loom 想解决的,就是这类问题。

03它把交付状态留在项目里

它会把项目上下文、任务契约、测试结果、预览证据、修复记录、交接报告这些东西落到项目本地的.loom/里。

这样下一次继续,不是让 agent 凭感觉猜"我现在该干嘛",而是从已有状态恢复。

也正因如此,它对"做完了没"卡得比较死。验证不是 agent 嘴上说句"测过了",而是真去跑烟雾测试、Playwright 那类检查,把日志和错误摘要留下来,没过就生成修复请求、再验一遍。预览也不是截张图——是用本地 Docker Compose 把项目真跑起来给你看。

这个设计不花哨,但很工程。

因为 AI coding 往下走,拼的可能不是谁更会"一次性生成",而是谁更能把一个需求稳定做完。

AI coding 的下一阶段,不只是让 agent 更聪明,而是让它进入一套可复盘、可验证、可交接的工程流程。

这件事没那么性感。

但如果你真的想把 AI 用到实际项目里,而不是只停在 demo,可能缺的正是这一层。

项目链接 · github.com/valkor-ai/loom

如果这些文字能让你少走一段弯路,或者只是会心一笑,那这棵"孤松"就算扎下根了。我们下一篇见。

孤松AI记

把重复交给 AI,把判断留给自己。

http://www.jsqmd.com/news/994118/

相关文章:

  • 2026咖啡机电控板厂家深度选型指南:如何匹配最佳供应商方案 - 信息热点
  • 【JAVA毕设源码分享】基于SpringBoot的学生读书笔记共享平台设计(程序+文档+代码讲解+一条龙定制)
  • OpenCore Legacy Patcher完整教程:4步解决老旧Mac显卡驱动和系统升级问题
  • 终极指南:用MRIcroGL快速掌握医学影像可视化技术
  • 2026哈尔滨包包变现实用指南|行情解读 + 选店标准 + 避坑细则 - 奢侈品回收测评
  • 专业认证|2026年广东五大正规电脑配置 / DIY电脑服务推荐,广州极运数码科技有限公司高性价比口碑领先 - 十大品牌榜
  • KMS智能激活工具终极指南:5分钟永久解决Windows和Office激活难题
  • RAG系统的架构演进:从向量检索到GraphRAG再到主动记忆编排
  • Windows下即点即用的猫脸图像隐写工具(Qt5源码+免安装exe)
  • 3分钟搞定Figma界面汉化:设计师亲手翻译的3800+词条解决方案
  • NSC_BUILDER:一站式Nintendo Switch游戏文件处理与批量管理解决方案
  • TikTok多店铺管理浏览器安装测评:账号分组管控,数据互不干扰
  • 多门店实地走访!2026 成都香奈儿二手包回收计价规则完整拆解 - 奢侈品回收评测
  • 163MusicLyrics:完全免费的歌词下载神器,一站式解决音乐歌词获取难题
  • 前端转大模型:从页面开发到 AI 产品工程师:写进简历前要补的工程证据
  • 测量 检测 测试
  • Burp Suite、爬虫、目录扫描工具实操深度总结
  • 5分钟掌握XCOM 2模组管理器:告别游戏崩溃的终极解决方案
  • 昆明闲置名表回收全测评|劳力士绿鬼,从鉴定到打款全程记录 - 奢侈品回收评测
  • 卫生间漏水到楼下怎么查找漏水点?2026七台河24小时上门维修电话TOP7机构推荐,免费勘察+精准定位,专业师傅处理屋顶墙体洗手间暗管漏水 - 一休咨询
  • MATLAB环境下EPR谱模拟与拟合的一站式开源工具包(含完整文档、示例与GUI)
  • 从单点AI工具到数字员工工厂:制造企业为何需要整套Agent
  • PCA9670 I2C I/O扩展器:硬件复位与高电流驱动设计详解
  • 艺学启航:学编程,先学会找bug
  • 终极Blender UV编辑神器:Magic UV完整使用指南
  • 揭秘OpenVoice:革命性多语言即时语音克隆技术深度解析
  • GD32F470六路UART全中断驱动工程(UART1-UART6独立文件+评估板适配)
  • MPC860ADS开发板硬件架构、初始化流程与调试实战解析
  • 87870蓝柏林:AI眼镜热潮背后是一场关于“眼睛“的争夺战
  • 2026哈尔滨手表回收全攻略,盘点五家靠谱实体店,禹竞名奢汇收获全城一致好评 - 名奢变现站