当前位置: 首页 > news >正文

我用 Codex 做周报自动化,第一件事是防止它胡写

时间都去哪儿了?

我每周最烦的时间点,基本就是写周报。

前阵子我粗略算了一下,过去 3 个月我光是手写 prompt、翻记录、拼周报,差不多花了 12 个小时。平均下来,每周 50 分钟左右。这里面写字的时间其实不多,大头都花在找材料上:翻 GitHub,看这周提交了什么;翻 Jira,看哪些 ticket 还在自己手里;最后再把这些碎片凑成一段还算体面的文字。

有一次快写完的时候,同事突然问我:"你这周 GitHub 上那个 PR 进度怎么样了?"

我才发现,那个 PR 被我漏掉了。

不是没做,也不是故意不写。就是翻到一半已经快到 deadline 了,脑子开始只想赶紧交差,于是漏了。结果周报看起来像是我这周只做了一个小需求。

这件事挺小,但让我开始认真想:周报最累的地方,可能不是"写",而是每周都要重新把自己做过的事捞一遍。

什么是 loop?

简单说,loop 就是让 AI 不只回答一次,而是按一套流程反复跑,直到条件满足才停。

以前的做法是:我写 prompt,AI 给结果,然后结束。Loop Engineering 更像是:我先设计一套流程,让它定时拉数据、生成草稿、检查结果;如果没过检查,就停下来留下原因。

所以它和 cron 不太一样。

cron 只是到点执行脚本。它不关心脚本结果好不好,也不会自己判断下一步该做什么。loop 里面多了一层判断:现在拿到了什么数据,够不够写,哪里缺了,能不能继续。

这层判断很麻烦。也正是这层判断,让它不只是"定时跑一下 AI"。

你的任务适合做成 loop 吗?

不是所有重复任务都值得上 loop。我现在会先看四件事:

  1. 这件事是不是每周都会发生?
  2. 跑完之后,能不能看出来成功还是失败?
  3. 中途失败后,能不能从失败点接着来?
  4. 省下来的时间,值不值得维护这套流程?

如果这四条里有两三条都说不清,先别急着自动化。写个一次性脚本,或者继续手动做,可能更省心。

周报这个场景比较适合。它每周发生,输入数据也比较清楚:GitHub、Jira、日历、文档。问题是这些数据分散在好几个地方,人每周手动捞一遍,很容易漏。

5 个组件怎么落到周报场景

Addy 的文章里提到 5 个组件,再加一个贯穿全程的 Memory:Automations、Worktrees、Skills、Plugins、Sub-agents,以及 Memory。

我第一次看这套东西时也有点头大。名词很多,但放到周报里,其实可以拆得很朴素:什么时候跑、按什么模板写、从哪里拿数据、在哪里隔离运行、谁来检查、怎么记录上次失败。

1 Automations:每周五 18:00 跑一次

Automation 就是闹钟。不过这里别手写一个看起来像配置文件的 YAML,然后期待 Codex 自动识别。

更稳的做法是在 Codex 桌面 App 里打开 Settings -> Automations -> New automation,填这几项:

  • Name:weekly-report-loop
  • Schedule:每周五 18:00
  • Workspace / CWD:周报工作区,比如~/weekly-report-loop
  • Execution environment:第一版先选local
  • Prompt:让 Codex 读取company-weekly-reportskill,按>2 Skills:把周报要求写清楚

    Skill 是这套流程的说明书。路径可以放在~/.codex/skills/company-weekly-report/SKILL.md

    一个最小版本大概长这样:

    --- name: company-weekly-report description: Generate a weekly company report draft from GitHub/Jira evidence, with source citations and a reviewer gate. --- # 目的 按公司周报模板,把本周工作汇总成文档,标注完成度与风险。 # 模板位置 - references/template.md # 公司模板(10 段固定结构) # 数据源(用 MCP,不要让 Agent 自己爬网页) - GitHub connector / MCP:本周 commits、PR、review、issue - Jira connector / MCP:本周更新过、由我负责或参与的 tickets - 如果 Jira 没接好,不要猜;写入 `[数据缺失,需补充:Jira]` # 产物路径 - raw/week-{W}.json:原始证据,只放结构化数据和来源链接 - draft/week-{W}.md:周报草稿 - review/verdict-{W}.json:reviewer 的结论,必须包含 pass 和 reasons - state/progress.md:每次运行追加一段状态 # 写作约束 - 每条 bullet 必须有数据源引用 [src:github:abc123] - 数字必须从 connector / MCP 返回,禁止 Agent 编造 - 不要写"下周计划"超过 5 条 # Gate - reviewer 必须检查全文每一段是否有来源 - review/verdict-{W}.json 里的 pass 不是 true,就不要发布

    这里最值得花时间写的是两块:数据源和写作约束。周报最怕的不是写得不漂亮,而是 AI 很自然地补一句看似合理的话。尤其是数字,没来源就别写。

    3 Plugins:先把数据接上

    Plugins 或 MCP 连接器,负责让 Codex 读到外部数据。周报里至少要接 GitHub。如果你们公司有 Jira/Atlassian connector,或者内部 MCP,再把 Jira 接上。

    # 先看当前 Codex 里有哪些插件 codex plugin list # 当前 Codex CLI 的安装命令是 add,不是 install codex plugin add github@openai-curated

    如果 Jira 不是插件市场里的现成 connector,而是公司内部 MCP,可以用这种方式接:

    codex mcp add company-jira --url https://your-company.example.com/mcp

    装完先确认一下:

    codex plugin list codex mcp list

    只读周报,不应该给写权限。能读就够了。repo:write这种权限,除非你真的要让它开 PR,否则别给。

    4 Worktrees:第一版不用急

    Worktrees 是隔离运行环境。要是这个 loop 会改代码、开 PR、跑测试,那最好给每个 agent 单独的 worktree。

    但周报第一版只是读数据、写草稿,用local就够了。等它稳定跑两三周,再考虑改成 worktree 环境。先跑通,比一上来把架构搭满更重要。

    5 Sub-agents:把三步写进 prompt

    这里不用急着发明一套流水线配置。第一版最容易跑通的办法,是在 automation prompt 里把三步写清楚:

    请按三步执行: 1.>6 Memory:把上次失败记下来

    Memory 先别想复杂。第一版就放一个state/progress.md

    # Weekly Report Loop State ## Last Run - week: 2026-W23 - raw_path: raw/week-2026-W23.json - draft_path: draft/week-2026-W23.md - verdict_path: review/verdict-2026-W23.json - gate_passed: true ## Backoff - consecutive_failures: 0 - next_attempt_at: 2026-06-12T18:00:00+08:00 ## Failures Log - 2026-W19: gate_failed(reviewer caught hallucinated ticket count)

    不要默认 App 会帮你维护这个文件。把"每次运行必须追加 state/progress.md"写进 automation prompt 和 SKILL.md。下一次运行时,先读上一次为什么失败,再决定要不要继续。

    我踩过的 3 个坑

    跑起来之后,我遇到过几个很烦的问题。不是大事故,但足够让人不敢直接全自动发布。

    踩坑①:安静失败(Quiet Failure)

    有一次周五 18:00 触发后,Jira token 过期了。data-fetcher 没有明确报错,只返回了空数据。

    drafter 看见空 raw,就写了一句"本周无 Jira 进展"。reviewer 只检查引用是否一致,所以也过了。周报发出去以后,周一才发现少了一大块。

    后来我加了三条规则:

    1. data-fetcher 失败时必须写state/fetch-error.md,不写就当整个 loop 失败。
    2. connector 报错或返回结构异常时,直接停止,不进入 drafter。
    3. 如果本周 commits 和 tickets 都是 0,reviewer 要直接 fail,除非 raw 里有明确的休假或停工证据。

    踩坑②:周报幻觉(Weekly Report Hallucination)

    另一次,模板里有"用户增长"段落,但 GitHub 返回的只是后端 commits。drafter 顺手写了一句"本周 DAU 上升 12%"。

    这数字完全没来源。

    reviewer 当时没拦住,因为它只检查了有引用的段落。没有引用的段落,反而被跳过去了。

    后来我把规则改成:

    1. 没有原始数据的段落,写[数据缺失,需补充]
    2. reviewer 扫全文,不是只扫有引用的行。
    3. DAU、MAU、转化率这类业务指标,只能来自数据看板 MCP,不能从 commit 或 PR 里推断。

    踩坑③:Token 失控(Token Runaway)

    还有一次,reviewer fail 了。automation 重试时,drafter 把上周 draft 当作上下文示例塞了进去。重试几次后,token 消耗开始变得离谱。

    这类问题不一定马上炸,但它会让你越来越不敢开自动化。

    我现在的做法是:

    1. prompt 里写清楚,只读取本周 raw、模板和最近一次 progress。
    2. drafter 不带历史 draft 作为示例。
    3. reviewer 失败后,先看规则哪里有问题,不要马上重跑整条链路。

    动手试试

    如果你想做一个自己的周报 loop,可以先按这个顺序来。别一上来追求无人值守。

    Step 1:先做一次 4 条件测试

    把你每周都要做的任务,放进前面的 4 个问题里过一遍。答不上来,就先别做 loop。

    Step 2:准备周报工作区

http://www.jsqmd.com/news/1087994/

相关文章:

  • 速存!一键扒光短视频水印的神器来了!
  • D3KeyHelper:暗黑3智能按键辅助工具,优化你的游戏操作流程
  • 【FI】SAP ODN实战:从配置到调优的完整指南
  • 跨平台兼容方案:在macOS上无缝运行Windows应用
  • BetterNCM安装器:5分钟解锁网易云音乐插件化新体验
  • 大模型MoE稀疏激活原理与工程实践:从1.8万亿参数到2%计算真相
  • RA8P1 OSPI接口配置与调试:从基础原理到实战避坑指南
  • SOP —— 构建RBD模拟的基石
  • 3分钟上手Aimmy:免费AI瞄准辅助工具让游戏体验全面提升
  • 3步搞定离线漫画库:哔咔漫画下载器的终极使用指南
  • 早高峰ETC车道频现读卡失败 全绿监控为何抓不住毫秒级淤堵
  • oebuild企业级部署实践:大规模嵌入式系统构建的最佳方案
  • 如何实现移动端AI混合架构:Maid项目的深度技术解析与架构设计
  • 录播姬完整教程:3分钟学会B站直播自动录制与修复
  • 【软考高级VS PMP项目管理认证终极对比】:20年IT治理专家亲授选证策略,错过再等1年!
  • 双下降现象:为什么更大模型反而性能下降
  • Selenium与PyAutoGUI联动:突破Web自动化测试的浏览器沙盒限制
  • 从信息学奥赛到工程实践:深入解析高精度加法算法
  • PTA - 二叉搜索树的结构 (30 分)——从建树到关系判定的实战解析
  • 人脸识别登录安全渗透测试:攻击面分析与实战绕过技术
  • 【学习笔记】SFT微调实战:LoRA / QLoRA / 全参微调对比(7/35)
  • 【单片机毕业设计】基于 STM32 的室内环境监测与智能家电控制系统,基于 STM32 的温湿度光照采集与设备自动调控设计(012801)
  • 终极ncmdumpGUI指南:3步快速解密网易云音乐NCM加密文件
  • 7-Zip:免费又好用的压缩软件,让文件管理变得如此简单
  • 深度解析 SuperSplat:当 Vibe Coding 遇上 3D 高斯泼溅,我们该如何重新定义开发体验?
  • 如何快速恢复Godot游戏项目:gdsdecomp逆向工程工具终极指南
  • 软考高级职称申报全流程拆解:从报名到公示的12个关键节点与3类高频驳回原因分析
  • AdminLTE实战:从零构建响应式后台管理界面(网页模板高效开发指南)
  • CC-RL编译器中断处理与代码优化:pragma指令详解与实战
  • 5分钟掌握BetterNCM安装器:让网易云音乐体验全面升级的终极指南