当前位置: 首页 > news >正文

AI 提速 3 倍,交付反而慢了?

—— 阿明餐厅"代码量暴涨但价值下滑"的复盘

阿明餐厅·续集 19


一、开场:老板阿明的"AI 革命 2.0"

2026 年下半年,阿明的餐厅连锁开到第 80 家。

续集 18 那场"AI 写代码翻车"的复盘会后,阿明做了 3 个决定(AI 协作工程师 + Harness + 工程责任不可下放)。现在他想看看"AI 革命"的真实收益

季度汇报会上,研发负责人小王兴奋地展示数据:

指标6 个月前现在提升
代码提交量1.2 万行/月3.8 万行/月🚀 +217%
采纳的 AI 代码03.2 万行/月——
AI 代码采纳率——84%——
新功能上线数8 个/月14 个/月+75%
Token 月成本$0$8.5 万新增

老板阿明看完数据,拍桌子:“再招 5 个 AI 协作厨师(Cursor + Claude Code),明年开到 200 家!”

阿明的厨房类比(开篇场景):上面这张表就像阿明的厨房数据 —— “新菜数"暴涨(从 8 道/月到 14 道/月),但"差评数"也跟着暴涨(从 8 条/月到 23 条/月)。阿明只看到"新菜多了”(代码量暴涨),但没看到"顾客投诉多了"(事故 + 差评)。这是典型的"厨房效率悖论" —— 出餐速度提升,但顾客满意度反而下降。

小王欲言又止,但被 CEO 的兴奋打断了。


二、第一幕:6 个月后,账单来了

到了年底盘点,技术总监老张拿出另一份数据——质量与运营指标

指标6 个月前现在变化
生产 bug 数12/月58/月❌ +383%
P0 事故数0/月2/月❌ +200%
客户投诉(系统类)8/月23/月❌ +188%
工程师平均加班35 小时/月62 小时/月❌ +77%
工程师离职率8%/年22%/年❌ +175%
月度云成本$4 万$15 万❌ +275%
Token + 云 总成本$4 万$23.5 万❌ +488%

阿明傻眼了:“新菜数涨了 3 倍,差评数也涨了 5 倍,成本涨了快 5 倍——这到底是怎么回事?”

阿明的厨房类比(第一幕):把"代码量"换成"菜品数",“Bug"换成"差评”,这张表就一目了然 —— 阿明的厨房从"每天 8 道新菜(手工研制)“变成"每天 14 道新菜(AI 协助)”,但"差评"从每月 8 条涨到 23 条。这就是 AI 时代的"厨房效率悖论" —— 出餐快了,但顾客投诉也多了


三、第二幕:老张用数据复盘

老张拿出了 Waydev、GitClear、Faros AI、Jellyfish 等 4 大研究的最新数据,开始逐项拆解。他把每个数据都翻译成厨房场景,让阿明秒懂。


三、第二幕:老张用数据复盘

老张拿出了 Waydev、GitClear、Faros AI、Jellyfish 等 4 大研究的最新数据,开始逐项拆解。

数据 1:Waydev——“采纳率 ≠ 有效率”
AI 代码采纳率:84%(看着很美) 但 6 周后这些代码还在吗? ┌──────────────────────────────────────────┐ │ 80-90% 采纳率 → 6 周后只剩 10-30% 留存 │ │ │ │ 这就是"代码流失"(Code Churn)—— AI 代码 │ │ 被采纳、被修改、被重写、被删除,最终没留下 │ │ 任何有效价值 │ └──────────────────────────────────────────┘

老张解释:“我们 84% 的采纳率看似很高,但6 周后真正留在生产环境的 AI 代码可能只有 20-30%——其余的不是被改就是被删,相当于做了无用功。”

数据 2:GitClear——“AI 代码修改率 9.4 倍”
非 AI 时代的代码:平均 2 周内被修改 1 次 AI 时代的代码: 平均 2 周内被修改 9.4 次 意味着: ✅ 工程师短期内"提交"得快 ❌ 但代码"稳定"得慢,bug 更多、技术债更深

老张苦笑:“团队感觉’产出多了’,其实是修改次数多了,不是有效产出多了。”

数据 3:Faros AI——“代码变更率 +861%”
PR 数:+861% 这意味着工程师疲于应付 PR review → review 质量下降 → 漏掉的 bug 上升 → 线上事故率上升
数据 4:Jellyfish——“吞吐量 2 倍,Token 10 倍”
吞吐量(commit 数):+200% Token 成本: +1000% 投入产出比: 1 个工程师的成本 = 工资 + Token 订阅 AI 时代的"边际成本"反而上升了

老张算了一笔账:“智能灶订阅费 + 食材成本 + 厨师加班费 + 离职补偿金,AI 时代的总成本可能比 AI 之前还高 30%。”

厨房类比:老张换算给阿明听 ——“老板,1 个 AI 协作厨师的月成本 = 工资(2 万)+ AI 订阅(3000)+ 智能灶(5000)+ 食材浪费(8000)= 3.6 万/月,比传统厨师贵 80%。但产出只提升了 50%。边际成本反而上升了。”


四、第三幕:3 大真相

老张在白板上画了 3 个真相。每个真相都用"厨房场景"翻译:

真相 1:AI 是放大器,不是替代品(DORA 2025)

DORA 2025 报告核心结论:“AI 是放大器,放大组织已有的优势和劣势。”

厨房类比:AI 不是"新厨师",而是"新厨房设备"(智能灶、自动翻炒机)。好厨师 + 智能灶 → 大厨级别(米其林出品);烂厨师 + 智能灶 →更快地做出烂菜(1 小时出 100 道糊了的菜)。

  • 好的团队 + AI → 更好(出品稳定、研发新菜快)
  • 烂的团队 + AI → 更烂(出品失控、差评暴涨)
  • 阿明的厨房在没有"Harness(标准化操作手册)"、没有"试菜流程(review)"的情况下用 AI 设备 →放大的是"烂"
真相 2:初级 vs 资深工程师的鸿沟
资深工程师用 AI: - 知道 AI 写的代码哪里需要 review - 知道哪些是陷阱、哪些可以采纳 - 采纳率 60-70%,但修改率 1.5x - 实际价值:显著提升 ✅ 初级工程师用 AI: - 看到 AI 生成的代码就"哇好厉害" - 全部采纳,几乎不 review - 采纳率 90%,但修改率 9.4x - 实际价值:反而下降 ❌

老张:“初级工程师用 AI 越多,返工量越大——他们缺乏识别’哪些代码是 AI 幻觉、哪些是过时的库、哪些有安全漏洞’的能力。”

真相 3:代码量 ≠ 价值
传统考核:代码行数、commit 数、PR 数 → AI 让这些数字暴涨 → 但实际交付价值(用户满意度、生产稳定性)反而下滑 真正的考核应该是: - 有效功能数(用户能用、爱用) - 生产稳定性(MTTR / 事故率) - 技术债(认知债 / 代码流失率) - Token 投入产出比

五、第四幕:阿明的最终决定

复盘后,阿明做了 4 个决定:

1. 改考核指标:不再看代码量,看有效价值
旧考核新考核
代码行数有效功能交付数
Commit 数变更失败率
AI 采纳率6 周后代码留存率
工程师产出MTTR / 客户满意度
2. 强制 Harness 流程
  • 所有 AI 代码必须经过资深工程师 review 才能合并
  • 关键模块(支付、安全)禁止 AI 直接写,必须人工
  • 引入 Claude Code 的 Hooks 自动校验
3. Token 成本透明化
  • 每个工程师每月 Token 预算 $2000
  • 超预算的需要 review 工作流
  • 引入 cheaper 模型做"参考",expensive 模型做"决策"
4. 初级工程师强制培训
  • 3 个月"AI 协作工程"专项培训
  • 必须识别 5 类 AI 常见陷阱(安全/性能/幻觉/过时/技术债)
  • 通过考试才能参与 AI 项目

3 个月后(阿明的厨房新指标):

  • 新菜数:从 14 道/月降到 9 道/月(-34%)——数量降了
  • 差评数:从 23/月降到 9/月 ——质量升了
  • 招牌菜留存率:从 22% 升到 68% ——价值升了
  • 厨师加班:从 62 小时降到 40 小时 ——健康升了
  • AI 订阅费:从 $8.5 万降到 $5 万 ——成本降了

厨房类比:阿明最终把"代码量考核"换成"招牌菜留存率考核"。3 个月后 —— 新菜少了 34%,但每道菜都是真招牌,差评少了 60%,回头客多了 50%。这才是 AI 时代的正确玩法:少而精,不多而烂

阿明在年终总结写道:

“AI 不是让代码变多,而是让有效代码变多。2026 年我们最大的教训是:不要被 AI 的数量迷惑,要看 AI 的价值。”


六、给所有研发管理者的启示

  1. AI 提速 ≠ 价值提升——数据告诉你,吞吐量 2 倍时事故可能 5 倍
  2. 采纳率 ≠ 有效率——Waydev 的"采纳率 80% → 留存 30%"是最重要的反直觉数据
  3. 初级 ≠ 更受益——DORA 2025 明确指出 AI 放大的是"已有能力",不是"弥补差距"
  4. 考核要换指标——考核代码量的团队会被 AI 反噬

七、相关章节

  • 44-ai-engineer-responsibility— 续集 18:AI 替你写代码,谁替系统负责(本篇是续集 18 的"数据真相"延伸)
  • 46-tech-debt-career-trap— 续集 20:技术债困局(本篇是续集 20 的"组织/团队"侧输入)
  • 续集七:31-codebase-cognitive-debt— 认知债:代码流失的根因
  • 续集八:32-agent-harness— Harness:减少代码流失的工程解药
  • 咬文嚼字:13.split-hairs/11.ai/ai-coding-productivity-paradox— 4 大研究 + DORA 框架
  • 咬文嚼字:13.split-hairs/11.ai/ai-code-churn— 代码流失率专题
  • 咬文嚼字:13.split-hairs/11.ai/ai-coding-roi— ROI 度量框架
  • 主模块:11.ai/05-applications— AI 行业应用与效能度量

📅 2026-06-28 · 续集 19 · AI 时代反思 · 阿明餐厅

http://www.jsqmd.com/news/1094471/

相关文章:

  • DeepEval终极指南:5分钟掌握AI模型评估框架的完整配置
  • Android应用安全实践:SafetyNet机制解析与safetynett库集成指南
  • 网安新手攻克 Kali 难题大全!各类高频报错一次性给出解决方案,搞定环境问题稳步进阶,冲刺高薪安全赛道
  • 肌理质感艺术木纹与仿石铝单板轻盈演绎
  • 5分钟免费实现VR视频转2D的终极指南:VR-Reversal完整教程
  • QNAP TS-h2490FU 2U 全闪存架构在精密电子贴片制造网中
  • 轻量级图书馆借阅管理系统(读者管理、借还书记录)
  • Minecraft光影终极指南:用Revelation打造电影级方块世界
  • 从单点工具到全链路智能体:跨境电商自动化的下一步:2026全链路AI Agent架构深度拆解与落地指南
  • 【工具推荐】剁手前先泼盆冷水!我做了一个让你理性消费的神器——消费泼冷水计算器
  • 3个MeEdu二次开发实战技巧:从API调用到Hook扩展的深度定制指南
  • 5步掌握Res-Downloader:跨平台资源下载工具全面指南
  • Audition软件安装步骤(附安装包)Audition AU2026 超详细下载安装教程
  • CAD看图入门教程:4步掌握文件新建、打开、保存、关闭基础操作
  • 2026年小程序和网站到底有什么区别?企业到底该做哪个?
  • 【那黎宣大学主办 | IEEE出版 | 连续2届稳定EI检索,往届快至会后4个月EI检索 |支持latex和word双通道投稿】第三届图像处理、多媒体技术与机器学习国际学术会议(IPMML 2026)
  • Vulnhuntr架构解析:LLM与符号查找器如何革新自动化漏洞挖掘
  • 企业级Python自动化利器:we-work-bot企业微信机器人框架深度解析
  • UltraStar Deluxe终极指南:免费开源卡拉OK游戏的完全探索
  • (安装包)Windows OpenClaw 超详细安装!纯可视化操作,小白一遍装好
  • UltraStar Deluxe:终极免费卡拉OK唱歌游戏完全指南 [特殊字符]
  • 黑龙江省熙慧科技服务有限公司
  • 基于AI与工作流引擎构建网络安全威胁情报自动化分析平台
  • 配音工具怎选?2026自媒体避坑指南,新手选配音工具看这4点就够了
  • 板书笔记如何搭配会议录音精准归档?方法来了
  • Windows风扇控制终极指南:用Fan Control彻底解决电脑噪音与散热问题
  • 办公自动化工具 OpenClaw 完整安装流程,小白友好指南(包含安装包)
  • 一套源码就能搞家政平台?听听过来人怎么说
  • 偏振旋转器的设计与应用
  • 史上最详细蓝凌EKP V16安装教程及安装包(完整)