如果你已经生活在 Claude Code 里面,你就知道一些显而易见的事情(终端原生、紧密循环、观察运行、grep 日志、打补丁、重新运行、提交)。所以这里有个更有趣的问题: 为什么 Codex 感觉像是在追赶,而不是简单地克隆交互式终端代理的氛围? Codex 是以委托为先,而不是以对编程为先。 Claude Code 的超能力是紧密的交互控制循环: 你和代理共享一个驾驶舱。它是可观察的。你可以在飞行中干预。你可以在它走上错误路径之前进行引导。它基本上是代理作为你 shell 的扩展。 Codex 的赌注是不同的:代理作为一个在自己电脑上工作的平行同事。 这种框架暗示了一些产品后果,如果你只比较模型输出,很容易就会错过: 1)异步作为一个特性(而不是副作用) Codex 设计是为了让你交接一个任务,去做其他事情,然后回来查看可审查的工件。 重心变成了 PRs/diff。这就是为什么你会看到“委托”、“丰盈心态”、“排队一堆任务”等语言。工作流程是:生成 N 个任务,然后审查/合并。 2)隔离和沙箱不仅仅是基础设施,它是用户体验。 每个任务在其自己的隔离环境中运行改变了信任模型:代理可以运行测试、修改文件、生成提交,而不会污染你的本地工作区。你获得了安全边界(通常是保守的默认设置),这使得让它去做变得更容易。 3)可合并性是实际的目标指标。Claude Code 感觉很好,因为循环收敛。而 Codex 明确优化的是返回可以合并的内容。 所以比较的形状变得更清晰: Claude Code = 当任务需要中途判断、快速中断和人类引导时最好。它是“紧密的驾驶舱循环”。 Codex = 当任务可以被委托、并行化,并作为可合并的工件返回时最好。它是“拥有自己工作区的同事”。 ...