limboy: 本文作者 Peter Steinberger 分享了他在使用代理工程（Agentic Engineering）方面的最新进展和经验，强调了“直接对话”（Just Talk To It）的无废话方法。他指出，代理工程已能生成几乎 100% 的代码，但许多人仍在尝试复杂的方法而非直接解决问题。作者主要使用 codex CLI 工具，并行运行多个代理，并让它们进行原子提交，以保持 Git 历史的整洁。他偏爱 gpt-5-codex 模型，认为它在智能和速度之间取得了很好的平衡，并能自动调整思考深度。作者提出了“爆炸半径”（Blast Radius）的概念，即在进行代码更改时预估其影响范围和所需时间，以便及时干预或停止代理。他解释了为何不使用 Git worktrees，主要是为了在单个开发服务器上同时测试多项更改，提高效率。在模型选择上，他明确表示放弃了 Claude Code，转而使用 gpt-5-codex，理由包括 codex 更大的可用上下文、更高效的 token 使用、消息队列功能、更快的速度、更友好的语言风格以及避免生成随机 Markdown 文件等。他认为，订阅模式比 API 调用更具成本效益，并对其他代理工具（如 amp、Factory、Cursor 等）持保留态度，认为它们难以长期超越大型 AI 公司。在提示词编写方面，作者发现 codex 对上下文的理解能力更强，因此提示词可以显著缩短，甚至只需一两句话加上截图。他强调截图作为上下文补充的有效性。对于计划模式，他认为 codex 的强大理解能力使其不再需要复杂的计划文件，只需“讨论”或“提供选项”即可。他批评了 Claude Code 的插件和子代理功能，认为它们是模型效率低下的修补，并指出子代理的上下文控制不如手动多窗口操作。作者还讨论了 MCPs（多功能命令行程序），认为大多数 MCPs 应该被简化为 CLI 工具，以避免上下文浪费和成本。他分享了自己通过代理进行重构的经验，这占据了他约...

本文作者 Peter Steinberger 分享了他在使用代理工程（Agentic Engineering）方面的最新进展和经验，强调了“直接对话”（Just Talk To It）的无废话方法。他指出，代理工程已能生成几乎 100% 的代码，但许多人仍在尝试复杂的方法而非直接解决问题。作者主要使用 codex CLI 工具，并行运行多个代理，并让它们进行原子提交，以保持 Git 历史的整洁。他偏爱 gpt-5-codex 模型，认为它在智能和速度之间取得了很好的平衡，并能自动调整思考深度。

作者提出了“爆炸半径”（Blast Radius）的概念，即在进行代码更改时预估其影响范围和所需时间，以便及时干预或停止代理。他解释了为何不使用 Git worktrees，主要是为了在单个开发服务器上同时测试多项更改，提高效率。在模型选择上，他明确表示放弃了 Claude Code，转而使用 gpt-5-codex，理由包括 codex 更大的可用上下文、更高效的 token 使用、消息队列功能、更快的速度、更友好的语言风格以及避免生成随机 Markdown 文件等。他认为，订阅模式比 API 调用更具成本效益，并对其他代理工具（如 amp、Factory、Cursor 等）持保留态度，认为它们难以长期超越大型 AI 公司。

在提示词编写方面，作者发现 codex 对上下文的理解能力更强，因此提示词可以显著缩短，甚至只需一两句话加上截图。他强调截图作为上下文补充的有效性。对于计划模式，他认为 codex 的强大理解能力使其不再需要复杂的计划文件，只需“讨论”或“提供选项”即可。他批评了 Claude Code 的插件和子代理功能，认为它们是模型效率低下的修补，并指出子代理的上下文控制不如手动多窗口操作。

作者还讨论了 MCPs（多功能命令行程序），认为大多数 MCPs 应该被简化为 CLI 工具，以避免上下文浪费和成本。他分享了自己通过代理进行重构的经验，这占据了他约 20% 的时间，并认为这种迭代与维护相结合的方式更高效有趣。在开发方法上，他从过去的“规范驱动开发”转向了与 codex 共同讨论和迭代新功能，尤其是在 UI 工作中，通过实时观察浏览器更新来逐步完善功能。他分享了少数几个斜杠命令，并提供了一些提高代理效率的技巧，如排队“继续”消息、让模型在每次功能/修复后编写测试、以及使用触发词来解决难题。最后，他强调了代理文件（Agents.md）的重要性，其中包含了产品说明、编码偏好、技术栈细节等，并指出 gpt-5-codex 在遵循这些指令方面远优于 Claude。尽管 gpt-5-codex 并非完美，但其整体表现使其成为作者的首选。他总结道，代理工程的关键在于“直接对话”、培养直觉，并认识到管理代理的技能与管理工程师的技能相似，而编写高质量软件依然充满挑战。

limboy

4 天前

就 codex 和 claude-code，我的体验也差不多：

claude-code: 聪明，但没什么耐心，喜欢走捷径。
codex: 聪明，非常有耐心。