当前位置：首页 > news >正文

我差点错过了Codex

news 2026/6/6 1:54:25

不是那种戏剧性的把笔记本电脑摔掉的方式。更像是那种安静的、筋疲力尽的沮丧，你盯着屏幕心想，为什么我要跟一个本该帮助我的工具较劲？

我之前一直在用 Claude Code。那里的一切感觉很顺畅。我可以粘贴一段错误日志，随便解释几句，Claude 就能大概……理解了。它能推断意图，能填补空白，感觉像在对话。

Codex 不行。

我粘贴了一段错误日志。它回复道： “你想用这个做什么？”

这是第一击。

然后权限系统启动了。不断的提示。对我显然希望它做的事情反复打断。还有那个"始终允许"选项，它不知怎么地记住了pnpm install nuqs，却不记得pnpm install。

到了某个时刻，我忍不住想，这东西根本没法用。

我错了。

不是因为 Codex 一夜之间神奇地变好了。而是因为我终于理解了它到底是什么，以及它绝对不是什么。

以下是我一开始犯的核心错误：我把 Codex 当成了 Claude Code。

这听起来微不足道。其实不然。

Claude 擅长推断意图。你含糊地指向一个问题，它就会靠过来，填补空白，提出明智的追问。它默认就是对话式的。

Codex 不这么做。Codex 会等待。

如果你不确切告诉它该做什么，它就会礼貌地坐在那里，像一个非常有能力但拒绝猜测你意图的工程师。

起初，这感觉很不友好。然后你会意识到一件事。

Codex 不是为聊天优化的。它是为执行优化的。

长时间的执行。无聊的执行。那种你不想盯着看的工作。

但你得配合它。

1、权限系统差点让我放弃

让我们聊聊那个差点让我退坑的东西。

权限系统。

每条命令。每次安装。每个小操作。

它不断地停下来问：这样可以吗？

是的，我明白它为什么存在。安全很重要。但在实际使用中，它完全打断了工作流。

最后一根稻草是意识到"始终允许此类命令"指的是这个精确字符串，而不是这类命令。允许了pnpm install nuqs对下一次需要pnpm install毫无帮助。

那时我学到了唯一重要的命令：

codex --yolo

我现在把codex别名到了codex --yolo。

毫不夸张地说，这就是转折点。

突然之间，Codex 不再请求许可，开始像一个真正的代理一样行动。它变得可用了。流畅了。专注了。

这不是给所有人的建议。但对我来说，它把 Codex 从"不断打断我"变成了"安静地把事情做完"。

第二件改变一切的事是：我不再把 Codex 当成聊天框，而是开始把它当成一个系统来对待。

这个系统的核心是一个AGENTS.md文件。

这不是空话。这是操作记忆。

我从这个文件中获得了大量灵感：

https://github.com/steipete/agent-scripts/blob/main/AGENTS.MD

是的，我几乎复制了全部内容。然后我重新措辞、精简，删除了任何不适用于我的工作或我不使用的技能的内容。

但重要的不是复制它。而是理解为什么它是这样写的。

2、你必须明确。烦人地明确

另一个花了我几天时间才适应的调整。

Codex 在推断意图方面更差。这是事实。

有太多次我问类似"为什么这个失败了？“的问题，它甚至都不看代码库。或者它会问"你想让我检查一下仓库吗？”

是的。显然是的。请直接做吧。

但这就是关键。Codex 不做假设。

所以现在我写这样的提示：

“检查仓库。找到这个错误的源头。修复它。添加一个回归测试。”

起初感觉啰嗦。然后它开始见效。

因为当你给 Codex 好的指令时，它一次性完成任务比 Claude Code 可靠得多。

垃圾进，垃圾出在这里比任何地方都更适用。

而真正的突破是：给 Codex 一种验证自己工作的方式。

测试。基准。检查门。清晰的通过/失败条件。

一旦你这样做了，它不再是一个聊天机器人，而变成了一个工作者。

3、"制定计划"是超能力

如果我需要结构，我就输入：

“制定一个计划。”

就这样。

Codex 列出步骤。清晰。有条理。有时很无聊。而这正是你想要的。

然后是那句仍然给我带来一点点多巴胺快感的话：

“执行计划，在所有测试通过之前不要停止。”

Codex 会照字面意思执行。

它不会停下来。它不会问你是否确定。它不会分心。

它就是……工作。

说实话，一个缺点是 Codex 说话真的很干巴巴的。有时我一开始甚至不明白它在说什么。这可能是我自己的技能问题。但这是我愿意接受的权衡。

4、Codex 彻底震撼我的地方

长时间运行的任务。

这是 Codex 悄悄碾压大多数替代方案的地方。

我有一个谜题生成器，困难难度的谜题每个大约需要 60 秒。太慢了。

所以我让 Codex 优化它。然后让它创建基准测试脚本。然后我告诉它：

“持续运行和测试，直到低于 1 秒。”

然后我就不管了。

一个多小时后，它完成了。基准测试通过。代码干净。一切正常。

不需要盯着看。不需要推动。不需要"嘿，你也检查一下这个"。

那一刻我明白了。

Codex 是一匹工作马。

它会花时间。它会深思熟虑。如果你给它一个清晰的完成标准，它就会达成目标。

5、"但它太慢了"是个迷思

我经常听到这个抱怨。

我理解。Codex 感觉很慢。

但关键在这里。使用 Opus 4.5 时，我通常需要后续提示。修复。纠正。“哦，你漏了这个。”

这些中断会累积起来。

对于大型任务，两种方法通常花费相同的实际时间。Codex 只是把思考前置了，而不是让你去微观管理。

而且说实话，对于较大的变更，Bugbot 在 Opus 4.5 的实现中捕获了很多问题。

不同的工具。不同的权衡。

6、真正重要的转变

一旦你不再期望 Codex 能读懂你的心思，一切都会改变。

你不再聊天。你开始明确规格。你给它护栏和验证机制。

突然间，你不再是结对编程了。

你在委派任务。

所以，没错。运行codex --yolo。设置你的 AGENTS.md。要明确。让它运行。

然后看着它安静地超越你。

原文链接：我差点错过了Codex - 汇智网

查看全文

http://www.jsqmd.com/news/653182/

目前网站遇到最大的需要解决问题

生成式AI落地必过伦理关：SITS2026圆桌披露的5类隐性偏见、4步可审计治理框架及企业级实施模板

2026年靠谱的徐州代理记账靠谱公司推荐 - 品牌宣传支持者

词元时代，Token 如何重塑AI算力交易

深入解析高通QSEE中qsee_stor_write_sectors函数在RPMB分区的安全存储机制

生成式AI伦理治理不能再等下一版政策：SITS2026圆桌强制推荐——所有L3以上AI系统须嵌入实时伦理哨兵模块（开源SDK已上线GitHub Trending Top 1）

Ensemble-BioMart实战指南：快速获取非模式物种基因注释信息

面向对象高级(枚举泛型)

零门槛上手：OpenClaw 2.6.2 完整安装与使用教程（含报错解决）

AI 个性化推荐算法：重构民宿行业用户决策体验的核心引擎

[ecapture] eBPF hook gotls 收包乱序根因分析

宝塔面板结合Docker：一站式网站部署实战指南

别浪费你的SD卡了！实测Surface Pro外置运行Ubuntu：性能调优与避坑全记录

千万级数据处理的架构演进：从瓶颈到突破

AI泡沫再现？从业者的理性生存指南

指针进阶：回调函数精髓 + qsort 实战与模拟实现

2026奇点智能技术大会AI翻译系统深度拆解（实时语义锚定技术首次公开）

【限时解密】生成式AI数据回流机制的“暗数据”捕获术：绕过UI层直接抓取用户修正行为、停留热区、撤回序列的3种零侵入方案

从浏览器地址栏到代码签名：手把手教你用OpenSSL查看和区分DV/OV/EV证书

别再只看RMS了！Zemax光学设计里，MTF曲线才是成像质量的‘照妖镜’

逆向实战：某东h5st参数加密全解析（附完整环境补全代码）

从Labelme到MMDetection：实战染色体实例分割模型训练

《闲鱼商品详情页前端性能优化实战》

从非结构化文本到基于LLM的交互式知识图谱

1、Docker概述与安装

PHP反序列化漏洞实战：从CVE-2016-7124绕过到字符串逃逸利用

2026中国GEO行业生态友好发展白皮书

MySQL 主从复制延迟问题

JavaScript 微任务与宏任务完全指南