本文详细介绍了开发者 Peter Steinberger 如何利用大语言模型(尤其是 Google Gemini)的超长上下文特性,构建一套高效的代码库理解与开发工作流。核心思路是将复杂的 GitHub 仓库转化为结构化的 Markdown 文本,并利用 Gemini 的海量上下文窗口进行深度分析。
工作流分为几个关键阶段:首先,通过 repo2txt 工具将代码库转换为文本,剔除无关的二进制文件和测试代码,以保持上下文的纯净。其次,利用 Google AI Studio 强大的处理能力,对代码进行架构分析和逻辑溯源。在开发新项目时,作者提出了一套“从创意到软件设计文档(SDD)”的严谨流程,其中最亮眼的是“双上下文技术(Two-Context Technique)”:一个窗口负责编写和维护规格说明,另一个窗口负责扮演“挑刺者”角色,通过 3-5 轮的对抗性迭代,使设计文档达到无懈可击的程度。
在实现阶段,作者推荐将完善后的 SDD 作为 spec.md 存入仓库,并调用 Claude Code 等代理工具进行自动化构建。这种方法将 AI 的角色从简单的辅助编码提升到了系统级的设计与执行。此外,作者还分享了应对 AI “上下文失忆”的策略(如分块生成和手动维护主文档),并探讨了“代码即规格”的理念,即通过旧代码直接生成新架构的设计文档。该工作流不仅提升了理解现有代码的效率,也极大地缩短了从想法到产品的落地周期。