当前位置: 首页 > news >正文

我差点错过了Codex

不是那种戏剧性的把笔记本电脑摔掉的方式。更像是那种安静的、筋疲力尽的沮丧,你盯着屏幕心想,为什么我要跟一个本该帮助我的工具较劲?

我之前一直在用 Claude Code。那里的一切感觉很顺畅。我可以粘贴一段错误日志,随便解释几句,Claude 就能大概……理解了。它能推断意图,能填补空白,感觉像在对话。

Codex 不行。

我粘贴了一段错误日志。 它回复道: “你想用这个做什么?”

这是第一击。

然后权限系统启动了。 不断的提示。 对我显然希望它做的事情反复打断。 还有那个"始终允许"选项,它不知怎么地记住了pnpm install nuqs,却不记得pnpm install

到了某个时刻,我忍不住想,这东西根本没法用。

我错了。

不是因为 Codex 一夜之间神奇地变好了。而是因为我终于理解了它到底是什么,以及它绝对不是什么。

以下是我一开始犯的核心错误:我把 Codex 当成了 Claude Code。

这听起来微不足道。其实不然。

Claude 擅长推断意图。你含糊地指向一个问题,它就会靠过来,填补空白,提出明智的追问。它默认就是对话式的。

Codex 不这么做。Codex 会等待。

如果你不确切告诉它该做什么,它就会礼貌地坐在那里,像一个非常有能力但拒绝猜测你意图的工程师。

起初,这感觉很不友好。然后你会意识到一件事。

Codex 不是为聊天优化的。 它是为执行优化的。

长时间的执行。无聊的执行。那种你不想盯着看的工作。

但你得配合它。

1、权限系统差点让我放弃

让我们聊聊那个差点让我退坑的东西。

权限系统。

每条命令。 每次安装。 每个小操作。

它不断地停下来问:这样可以吗?

是的,我明白它为什么存在。安全很重要。但在实际使用中,它完全打断了工作流。

最后一根稻草是意识到"始终允许此类命令"指的是这个精确字符串,而不是这类命令。允许了pnpm install nuqs对下一次需要pnpm install毫无帮助。

那时我学到了唯一重要的命令:

codex --yolo

我现在把codex别名到了codex --yolo

毫不夸张地说,这就是转折点。

突然之间,Codex 不再请求许可,开始像一个真正的代理一样行动。它变得可用了。流畅了。专注了。

这不是给所有人的建议。但对我来说,它把 Codex 从"不断打断我"变成了"安静地把事情做完"。

第二件改变一切的事是:我不再把 Codex 当成聊天框,而是开始把它当成一个系统来对待。

这个系统的核心是一个AGENTS.md文件。

这不是空话。这是操作记忆。

我从这个文件中获得了大量灵感:

https://github.com/steipete/agent-scripts/blob/main/AGENTS.MD

是的,我几乎复制了全部内容。然后我重新措辞、精简,删除了任何不适用于我的工作或我不使用的技能的内容。

但重要的不是复制它。而是理解为什么它是这样写的。

2、你必须明确。烦人地明确

另一个花了我几天时间才适应的调整。

Codex 在推断意图方面更差。这是事实。

有太多次我问类似"为什么这个失败了?“的问题,它甚至都不看代码库。或者它会问"你想让我检查一下仓库吗?”

是的。显然是的。请直接做吧。

但这就是关键。Codex 不做假设。

所以现在我写这样的提示:

“检查仓库。找到这个错误的源头。修复它。添加一个回归测试。”

起初感觉啰嗦。然后它开始见效。

因为当你给 Codex 好的指令时,它一次性完成任务比 Claude Code 可靠得多。

垃圾进,垃圾出在这里比任何地方都更适用。

而真正的突破是:给 Codex 一种验证自己工作的方式。

测试。基准。检查门。清晰的通过/失败条件。

一旦你这样做了,它不再是一个聊天机器人,而变成了一个工作者。

3、"制定计划"是超能力

如果我需要结构,我就输入:

“制定一个计划。”

就这样。

Codex 列出步骤。清晰。有条理。有时很无聊。而这正是你想要的。

然后是那句仍然给我带来一点点多巴胺快感的话:

“执行计划,在所有测试通过之前不要停止。”

Codex 会照字面意思执行。

它不会停下来。 它不会问你是否确定。 它不会分心。

它就是……工作。

说实话,一个缺点是 Codex 说话真的很干巴巴的。有时我一开始甚至不明白它在说什么。这可能是我自己的技能问题。但这是我愿意接受的权衡。

4、Codex 彻底震撼我的地方

长时间运行的任务。

这是 Codex 悄悄碾压大多数替代方案的地方。

我有一个谜题生成器,困难难度的谜题每个大约需要 60 秒。太慢了。

所以我让 Codex 优化它。然后让它创建基准测试脚本。然后我告诉它:

“持续运行和测试,直到低于 1 秒。”

然后我就不管了。

一个多小时后,它完成了。 基准测试通过。 代码干净。 一切正常。

不需要盯着看。不需要推动。不需要"嘿,你也检查一下这个"。

那一刻我明白了。

Codex 是一匹工作马。

它会花时间。它会深思熟虑。如果你给它一个清晰的完成标准,它就会达成目标。

5、"但它太慢了"是个迷思

我经常听到这个抱怨。

我理解。Codex 感觉很慢。

但关键在这里。使用 Opus 4.5 时,我通常需要后续提示。修复。纠正。“哦,你漏了这个。”

这些中断会累积起来。

对于大型任务,两种方法通常花费相同的实际时间。Codex 只是把思考前置了,而不是让你去微观管理。

而且说实话,对于较大的变更,Bugbot 在 Opus 4.5 的实现中捕获了很多问题。

不同的工具。不同的权衡。

6、真正重要的转变

一旦你不再期望 Codex 能读懂你的心思,一切都会改变。

你不再聊天。 你开始明确规格。 你给它护栏和验证机制。

突然间,你不再是结对编程了。

你在委派任务。

所以,没错。 运行codex --yolo。 设置你的 AGENTS.md。 要明确。 让它运行。

然后看着它安静地超越你。


原文链接:我差点错过了Codex - 汇智网

http://www.jsqmd.com/news/653182/

相关文章:

  • 目前网站遇到最大的需要解决问题
  • 【8G显存福音】最新TX-2.3-22B-DISTILLED-1.1-VBVR 整合包文生视频、图生视频,支持首尾帧/单图无限时长,50系显卡全适配!
  • 生成式AI落地必过伦理关:SITS2026圆桌披露的5类隐性偏见、4步可审计治理框架及企业级实施模板
  • 2026年靠谱的徐州代理记账靠谱公司推荐 - 品牌宣传支持者
  • 词元时代,Token 如何重塑AI算力交易
  • 深入解析高通QSEE中qsee_stor_write_sectors函数在RPMB分区的安全存储机制
  • 生成式AI伦理治理不能再等下一版政策:SITS2026圆桌强制推荐——所有L3以上AI系统须嵌入实时伦理哨兵模块(开源SDK已上线GitHub Trending Top 1)
  • Ensemble-BioMart实战指南:快速获取非模式物种基因注释信息
  • 面向对象高级(枚举泛型)
  • 零门槛上手:OpenClaw 2.6.2 完整安装与使用教程(含报错解决)
  • AI 个性化推荐算法:重构民宿行业用户决策体验的核心引擎
  • [ecapture] eBPF hook gotls 收包乱序根因分析
  • 宝塔面板结合Docker:一站式网站部署实战指南
  • 别浪费你的SD卡了!实测Surface Pro外置运行Ubuntu:性能调优与避坑全记录
  • 千万级数据处理的架构演进:从瓶颈到突破
  • AI泡沫再现?从业者的理性生存指南
  • 指针进阶:回调函数精髓 + qsort 实战与模拟实现
  • 2026奇点智能技术大会AI翻译系统深度拆解(实时语义锚定技术首次公开)
  • 【限时解密】生成式AI数据回流机制的“暗数据”捕获术:绕过UI层直接抓取用户修正行为、停留热区、撤回序列的3种零侵入方案
  • 从浏览器地址栏到代码签名:手把手教你用OpenSSL查看和区分DV/OV/EV证书
  • 别再只看RMS了!Zemax光学设计里,MTF曲线才是成像质量的‘照妖镜’
  • 逆向实战:某东h5st参数加密全解析(附完整环境补全代码)
  • 从Labelme到MMDetection:实战染色体实例分割模型训练
  • 《闲鱼商品详情页前端性能优化实战》
  • 从非结构化文本到基于LLM的交互式知识图谱
  • 1、Docker概述与安装
  • PHP反序列化漏洞实战:从CVE-2016-7124绕过到字符串逃逸利用
  • 2026中国GEO行业生态友好发展白皮书
  • MySQL 主从复制延迟问题
  • JavaScript 微任务与宏任务完全指南