35MM.COFFEEa site built for app makers
Profile
limboy

5 天前

本文作者 Peter Steinberger 分享了他在使用代理工程(Agentic Engineering)方面的最新进展和经验,强调了“直接对话”(Just Talk To It)的无废话方法。他指出,代理工程已能生成几乎 100% 的代码,但许多人仍在尝试复杂的方法而非直接解决问题。作者主要使用 codex CLI 工具,并行运行多个代理,并让它们进行原子提交,以保持 Git 历史的整洁。他偏爱 gpt-5-codex 模型,认为它在智能和速度之间取得了很好的平衡,并能自动调整思考深度。

作者提出了“爆炸半径”(Blast Radius)的概念,即在进行代码更改时预估其影响范围和所需时间,以便及时干预或停止代理。他解释了为何不使用 Git worktrees,主要是为了在单个开发服务器上同时测试多项更改,提高效率。在模型选择上,他明确表示放弃了 Claude Code,转而使用 gpt-5-codex,理由包括 codex 更大的可用上下文、更高效的 token 使用、消息队列功能、更快的速度、更友好的语言风格以及避免生成随机 Markdown 文件等。他认为,订阅模式比 API 调用更具成本效益,并对其他代理工具(如 amp、Factory、Cursor 等)持保留态度,认为它们难以长期超越大型 AI 公司。

在提示词编写方面,作者发现 codex 对上下文的理解能力更强,因此提示词可以显著缩短,甚至只需一两句话加上截图。他强调截图作为上下文补充的有效性。对于计划模式,他认为 codex 的强大理解能力使其不再需要复杂的计划文件,只需“讨论”或“提供选项”即可。他批评了 Claude Code 的插件和子代理功能,认为它们是模型效率低下的修补,并指出子代理的上下文控制不如手动多窗口操作。

作者还讨论了 MCPs(多功能命令行程序),认为大多数 MCPs 应该被简化为 CLI 工具,以避免上下文浪费和成本。他分享了自己通过代理进行重构的经验,这占据了他约 20% 的时间,并认为这种迭代与维护相结合的方式更高效有趣。在开发方法上,他从过去的“规范驱动开发”转向了与 codex 共同讨论和迭代新功能,尤其是在 UI 工作中,通过实时观察浏览器更新来逐步完善功能。他分享了少数几个斜杠命令,并提供了一些提高代理效率的技巧,如排队“继续”消息、让模型在每次功能/修复后编写测试、以及使用触发词来解决难题。最后,他强调了代理文件(Agents.md)的重要性,其中包含了产品说明、编码偏好、技术栈细节等,并指出 gpt-5-codex 在遵循这些指令方面远优于 Claude。尽管 gpt-5-codex 并非完美,但其整体表现使其成为作者的首选。他总结道,代理工程的关键在于“直接对话”、培养直觉,并认识到管理代理的技能与管理工程师的技能相似,而编写高质量软件依然充满挑战。

limboy

limboy

4 天前

就 codex 和 claude-code,我的体验也差不多:

  • claude-code: 聪明,但没什么耐心,喜欢走捷径。
  • codex: 聪明,非常有耐心。