这期视频是 Stripe 团队对科技评论通讯《Stratechery》创始人 Ben Thompson 的深度访谈。在这场对话中,Ben 结合其商业洞察,对当前科技行业的多个前沿议题进行了深入剖析。

首先,他将经典的“聚合理论”延伸至 AI 领域,探讨了 OpenAI 和 Google 等公司在商业化(尤其是广告业务)上的不同路径。他犀利地指出,比起直接在聊天中插入上下文广告,建立在深刻理解用户画像基础上的“Meta式广告”才是更优解。其次,他推演了“AI 代理电商(Agent Commerce)”的发展阶段,认为未来的 AI 不仅能优化搜索体验,更能提前预判并满足用户的购物需求。...

本文由 Jesse Vincent 撰写,介绍了他在 2025 年 10 月开发的名为 “Superpowers” 的 Claude Code 插件系统。该系统旨在通过“技能(Skills)”机制系统化地增强 AI 编码代理的能力。Superpowers 的核心理念是将复杂的开发流程(如头脑风暴、计划、实施、TDD 测试)转化为 AI 可检索和遵循的 Markdown 文档(SKILL.md)。

作者详细说明了 Superpowers 的工作流:它不仅能自动管理 Git worktree 以支持并行任务,还能在实施阶段调用子代理进行代码编写和审查。文章重点探讨了“技能”的本质——它们是 AI 的指令集,可以通过阅读书籍、分析历史对话或自我总结来不断进化。此外,作者还分享了如何利用心理学中的“说服原则”对 AI 进行压力测试,以确保其在紧急或高压场景下仍能严格遵守既定技能。目前,该项目已作为 Claude 插件发布,未来计划加入技能共享机制和基于 SQLite 的长期记忆系统,使 AI 能够检索过去的对话记录以辅助当前任务。

OpenViking 是由字节跳动火山引擎 Viking 团队开发并开源的上下文数据库(Context Database),专门为 AI Agent 设计。它旨在解决 Agent 开发中常见的上下文碎片化、检索效率低、不可观测以及内存迭代受限等痛点。

OpenViking 创新性地引入了**“文件系统范式”,将 Agent 所需的记忆(Memory)、资源(Resources)和技能(Skills)统一组织在虚拟文件系统结构中,通过 viking:// 协议进行管理。其核心特性包括:分层上下文加载(L0 摘要、L1 概览、L2 详情),有效降低 Token 消耗;目录递归检索策略,结合语义搜索与目录定位,提升检索的全局观和准确性;可视化检索轨迹,使上下文获取过程透明可调试;以及自动会话管理**,支持异步提取长期记忆,实现 Agent 的自我进化。...

Scrapling 是一个功能强大且灵活的 Python 网络爬虫框架,旨在解决现代网页抓取中的各种挑战。它不仅支持从简单的单次 HTTP 请求到大规模并发爬取的全场景应用,还具备卓越的“自适应”能力。其核心解析器能够学习网页结构的变化,当网站更新设计时,Scrapling 可以利用智能相似性算法自动重新定位目标元素,极大地降低了脚本维护成本。

在反爬虫绕过方面,Scrapling 内置了强大的工具,如 StealthyFetcher,能够开箱即用地面向 Cloudflare Turnstile 等高级反爬系统进行伪装,并支持 TLS 指纹模拟和 HTTP/3 协议。此外,它还提供了一个完整的 Spider 框架,支持多会话管理、自动代理轮换、爬虫状态的暂停与恢复,以及实时数据流处理。...

这是一篇关于 AI 智能体工程(Agentic Engineering)实战经验的深度分享。作者 Peter Steinberger 详细介绍了他在处理 30 万行代码的大型项目时,如何通过“直接对话”而非复杂的工程套路,实现 AI 编写 100% 代码的高效工作流。

本文核心观点是:回归简单,直接与 AI 对话(Just Talk To It)。作者认为,当前的 AI 智能体工程中存在过多的“花招”(如复杂的子代理、RAG、计划模式等),这些往往会降低效率。作者目前已全面转向使用 gpt-5-codex 命令行工具(CLI),并总结了一套实战经验:...

Cloudflare 推出了基于 Code Mode(代码模式) 的全新模型上下文协议(MCP)服务器,旨在解决 AI 智能体(Agent)在调用外部工具时面临的“上下文窗口压力”问题。传统的 MCP 服务器通过为每个 API 接口定义独立工具来工作,这在面对拥有数千个端点的复杂 API(如 Cloudflare API)时,会迅速耗尽模型的上下文配额。

Code Mode 的核心思想是**“以代码代替描述”**:不再向模型展示成百上千个工具定义,而是仅提供 search()(搜索)和 execute()(执行)两个核心工具。模型通过编写 JavaScript 代码来检索 OpenAPI 规范并执行复杂的 API 调用链。这种方式将 Cloudflare 全量 API 的上下文占用从 117 万个 token 骤降至约 1,000 个,降幅达 99.9%。...

Superpowers 是一个专为 AI 编程智能体(如 Claude Code、Cursor 等)设计的全流程软件开发框架。其核心理念是将复杂的开发任务拆解为一系列可组合的“技能”(Skills),并通过一套严谨的方法论强制智能体遵循“先思考、后计划、再编码”的原则。

该框架彻底改变了目前 AI 编程中常见的“直接生成代码”模式。当用户启动智能体并提出需求时,Superpowers 会自动触发“头脑风暴”技能,通过苏格拉底式的提问引导用户完善需求规格说明书。在设计获得批准后,智能体会利用 Git Worktrees 创建隔离的开发环境,并编写极其详尽的实施计划。该计划将任务拆解为每项仅需 2-5 分钟即可完成的微小单元,确保即使是缺乏判断力的“初级工程师”模型也能准确执行。...

App-Store-Connect-CLI 是一个由 Rudrank Riyam 开发的非官方、高性能且可脚本化的命令行工具,专门用于与 Apple 的 App Store Connect API 进行交互。该工具采用 Go 语言编写,旨在解决 iOS、macOS、tvOS 和 visionOS 开发者在发布流程中遇到的繁琐手动操作问题。其核心设计理念是“JSON 优先”和“无交互提示”,这使得它非常适合集成到自动化脚本、IDE 或 CI/CD 流水线中,而无需人工干预。

该工具的功能覆盖了 App 发布生命周期的各个阶段。在开发与测试阶段,它可以自动化管理 TestFlight 内部与外部测试、处理测试员反馈以及监控崩溃报告;在构建与分发阶段,它支持构建版本的上传、验证及提交审核;在元数据管理方面,它能够高效处理多语言本地化信息、屏幕截图和视频预览的同步;此外,它还提供了对代码签名(证书、描述文件)和 Bundle ID 的管理能力。...

本文深入探讨了如何为 AI 编码助手(如 Claude Code、Cursor 等)编写高质量的 CLAUDE.md(或其开源等价物 AGENTS.md)配置文件。核心观点在于,大语言模型(LLM)本质上是无状态的,它们在每次对话开始时对代码库一无所知,而 CLAUDE.md 是唯一会被默认注入到每一次对话中的文件。因此,该文件承担着“入职培训”的关键角色,必须清晰地告知 AI 项目的背景(WHAT)、目的(WHY)以及协作方式(HOW)。

文章强调了“少即是多”的原则。研究表明,前沿 LLM 只能稳定遵循约 150-200 条指令,且随着指令增加,遵循质量会统一下降。为了防止 Claude 忽略指令,CLAUDE.md 应保持精简(建议少于 300 行,甚至少于 60 行),且内容必须具有普适性。...

文章详细指导了如何搭建 Ralph 环境:首先安装 Claude Code 并配置 Docker 沙盒;接着利用 Claude 的“计划模式”生成 PRD 和进度跟踪文件;随后通过编写 Shell 脚本(如 ralph-once.sh 和 afk-ralph.sh)来实现从“人工干预循环”到“完全自动化循环”的过渡。自动化脚本利用了 Claude Code 的非交互模式(-p 标志)和自动接受编辑功能,通过识别特定的完成信号(如 COMPLETE)来终止循环。

最后,作者强调了 Ralph 的高度可定制性。它不仅可以从本地 PRD 获取任务,还能对接 GitHub Issues 或 Linear 等项目管理工具。此外,Ralph 还可以应用于提升测试覆盖率、修复 Lint 错误、重构重复代码等多种场景。这种“观察-改进-提交”的闭环模式为自主 AI 编程提供了一个简单而强大的框架。

opensrc 是由 Vercel Labs 开发的一款命令行工具,旨在解决 AI 编码智能体(AI Coding Agents)在处理第三方依赖时面临的“上下文缺失”问题。在当前的 AI 辅助开发流程中,智能体通常只能通过类型定义文件(.d.ts)或文档来理解 npm 软件包的功能。然而,类型定义往往无法揭示复杂的内部逻辑和具体实现细节。当 AI 需要深入理解某个库的运行机制以修复 Bug 或进行深度集成时,仅靠类型信息是不够的。

opensrc 通过自动化的流程,根据项目中 lockfile(如 package-lock.jsonpnpm-lock.yamlyarn.lock)记录的具体版本,从 npm 注册表追溯到源代码仓库,并将对应的源代码克隆到本地的 opensrc/ 目录中。该工具不仅支持 npm 软件包,还支持直接抓取任意公共 GitHub 仓库。...

every MCP server you connect loads its tool definitions into your context window. name, description, parameter schema, all of it. connect 10 servers with 5 tools each and you've burned 50 tool definitions worth of tokens before your conversation even starts.

I see the exactly problem while using the XcodeBuildMCP, Cloudflare's Code Mode might be a better solution which only expose search and execute while consuming only around 1,000 tokens.

本文以《辛普森一家》中天真、古怪且时常令人困惑的角色 Ralph Wiggum 为隐喻,深入探讨了在 AI 辅助编程时代,开发者应如何建立正确的协作心态与技术方法。文章的核心观点是:当前的 AI(如 ChatGPT、Claude、GitHub Copilot)就像一个极度聪明但又时常“短路”的实习生。它拥有海量的知识储备,却缺乏对特定项目上下文的深度理解,且容易产生“幻觉”。

为了高效利用 AI,开发者必须摒弃“一键生成完整应用”的幻想,转而采用增量式、迭代式的开发策略。文章提出了 11 条实用的建议,涵盖了从提示词工程(Prompt Engineering)到代码审查、从上下文管理到错误处理的全过程。重点强调了“小步快跑”的重要性,即每次只要求 AI 完成一个微小的、可验证的任务,而不是复杂的系统架构。同时,开发者需要提供丰富的上下文(如类型定义、文档片段),并始终保持对生成代码的逐行审查,确保代码的质量和安全性。...

Ralph for Claude Code 是一个专为 Anthropic 的 Claude Code(命令行 AI 助手)设计的自主 AI 开发循环框架。该项目由 frankbria 开发,其核心理念源自 Geoffrey Huntley 提出的 "Ralph" 技术,旨在实现 AI 的持续自主开发。

在传统的 AI 辅助编程中,开发者通常需要频繁地与 AI 交互、输入指令并检查结果。Ralph 通过构建一个“执行-评估-反馈”的闭环,允许 Claude Code 在无需人工干预的情况下,根据项目需求文档(PRD)或任务列表自主进行代码编写、测试和调试,直到任务完全达成。

为了解决自主循环中可能出现的失控问题,Ralph 引入了一系列工业级的保障机制:...

Ralph Wiggum AI Loop 技术是一种专为 Claude Code 设计的迭代式、自引用开发方法论。其核心思想是将 AI 代理置于一个持续的循环中,通过不断反馈和自我修正来完成复杂的编程任务。该技术得名于《辛普森一家》中的角色 Ralph Wiggum,象征着一种即便面临挫折也能坚持不懈、持续尝试的精神。

在技术实现上,Ralph Wiggum 表现为一个简单的 Bash 循环逻辑:只要任务未完成,就不断将提示词(Prompt)喂给 AI。这种方法打破了“单次生成”的局限,转而追求“迭代胜过完美”。它强调失败也是一种有价值的数据,通过确定性的错误引导 AI 进行自我修复。成功的关键不在于模型本身的完美,而在于操作者编写高质量提示词的能力。

为了方便开发者使用,官方推出了 ralph-loop 插件。用户可以通过简单的命令设定任务目标、最大迭代次数以及完成标识(Completion Promise)。该技术特别适用于目标明确、具有自动化验证手段(如测试用例、Linter)的任务,如 Greenfield 项目开发、TDD(测试驱动开发)和复杂的 Bug 修复。...

本文探讨了如何通过“高级上下文工程”解决 AI 编码工具在处理复杂、大型生产级代码库(即“棕地项目”,Brownfield Codebases)时表现不佳的问题。斯坦福大学的研究表明,AI 往往会产生大量“代码垃圾”(Slop),导致开发者在大型项目中生产力下降。作者提出,AI 编码不应仅仅是“凭感觉聊天”(Vibe Coding),而是一项严谨的工程学科。

核心方法论被称为**“频繁意图压缩”(Frequent Intentional Compaction, FIC)。其核心逻辑在于:LLM 是无状态的函数,上下文窗口是影响输出质量的唯一杠杆。通过主动管理上下文,将其利用率维持在 40%-60% 的最佳区间,可以显著提升 AI 的表现。作者将开发流程拆分为研究(Research)、计划(Plan)和实施(Implement)**三个阶段,并强调在“高杠杆”环节(如研究报告和实施计划)引入人工审查,而非仅仅在最后阶段审查代码。...

本文探讨了如何通过为 Anthropic 推出的命令行 AI 代理工具 Claude Code 集成特定的“TDD Skill(测试驱动开发技能)”,从而显著提升其编写高质量、健壮代码的能力。在传统的 AI 辅助编程中,开发者往往直接要求 AI 生成功能代码,这容易导致 AI 为了“完成任务”而忽略边缘情况,甚至产生看似正确实则含有逻辑漏洞的代码。

文章的核心观点是:通过引入 TDD 流程(即“红-绿-重构”循环),可以强制 Claude Code 在编写任何业务逻辑之前先定义测试用例。这种方法不仅改变了 AI 的思考路径,使其从“如何实现功能”转向“如何验证功能”,还利用了 Claude Code 强大的环境感知能力,使其能够自主运行测试、观察报错并根据反馈进行自我修正。...

本文作者 Boris Tane 分享了他使用 Anthropic 推出的命令行工具 Claude Code 的深度工作流。与大多数开发者“输入提示词、修复错误、重复”的随机模式不同,作者的核心原则是:在审查并批准书面计划之前,绝不让 Claude 编写任何代码。这种将“规划”与“执行”彻底分离的策略,是确保 AI 生成高质量、符合架构要求的代码的关键。

整个工作流分为三个阶段:...

本文核心观点认为,AI 智能体(AI Agents)并非仅仅提高了软件开发生命周期(SDLC)的速度,而是彻底终结了它。传统的 SDLC 是一个由需求分析、设计、编码、测试、评审、部署和监控组成的线性、离散且充满交付环节的过程。然而,在 AI 驱动的开发模式下,这些阶段正在发生“坍缩”,合并成一个由“意图、上下文和迭代”组成的紧密循环。

作者指出,新一代“AI 原生”工程师已经不再关注 Sprint 计划、故事点估算或长达数天的 PR(拉取请求)评审,他们直接通过与 AI 协作进行构建。在这种新范式下,需求不再是预先固定的文档,而是在与 AI 的快速迭代中产生的副产品;系统设计不再是前置的指令,而是在对话中共同发现的架构;测试与编码同步完成,传统的 QA 环节消失。...

本文探讨了如何复刻近期火爆的通用型 AI 智能体 OpenClaw(原名 ClawdBot),并分享了作者在基于 Bub 项目进行实践过程中,对于“AI Native(AI 原生)”概念的深度思考与范式转变。

作者将 AI 应用的发展划分为三个阶段:1.0 时代是传统的 Chatbot,每次对话仅对应一次模型推理;2.0 时代是 Agent 时代,引入了 Tool Call(工具调用),通过多轮推理完成复杂任务,如 Claude Code;而 3.0 时代则是真正的 AI Native,AI 不再被局限在预设的框架内,而是拥有极简的推理核心,能够自主管理工具、编写技能甚至构建自己的运行环境。

在复刻 OpenClaw 的过程中,作者最初尝试用传统编程思维为 Agent 适配 Telegram 接口,但随后意识到这种“框架式”的限制束缚了 AI 的潜力。受极简工具集思想的启发,作者转而采用一种更激进的方案:只给 AI 提供最基础的 Bash 和文件读写能力,让 AI 通过自然语言指令,自主调用 Telegram API 实现收发消息、处理图片及 Reaction 等功能。...

Claude Opus 4.5 确实强!一个颇有挑战的 Feature,Gemini 3.0 flash / Claude Sonnet 4.5 全部 fail(还聊了半天),Opus 4.5 几乎一把搞定。

Agent 会使用工具是好事,但就是太慢了,一套组合拳下来,花了半小时,结果可能就是改了一个变量···

让 AI 生成一些 landing 页的 prompts

This is not a website, this is art.

Tweet image

this pull-to-refresh is next level!

Antigravity is actually good!

Raph Koster 在其文章《我如何分析游戏》中,详细阐述了他作为游戏设计师分析游戏的方法论。他强调,分析游戏不应仅仅停留在玩家的主观体验层面,而应深入挖掘其“地下”的系统和机制。他将游戏体验比作山顶,而其下的地质构造(如构造板块、火山活动)才是决定山脉形态和位置的根本,这与冰山的比喻不同,因为冰山水上水下本质相同,而游戏体验与底层系统在本质上可能大相径庭。

Koster 的分析过程分为几个核心步骤。首先,他会抛开个人经验,剥离游戏的表面体验,直达其核心机制、输入、过程、规则和代币等系统层面。他认为新的游戏机制非常罕见,大多数游戏都是对现有机制的变体和深化。在这一阶段,他会探究游戏的可能性空间、玩家选择的后果、系统是否可被利用、技能的重要性以及玩家的学习过程和心智模型的构建。他进行这种机械层面的分析,主要是为了提升自己的设计技艺。...

一眼没有用的欲望,就挺 Google 的

Tweet image

挺喜欢这类工具的:界面简洁,功能聚焦,一次买断,持续更新。

这个网站上的声音素材用来作为 Marketing Video 的背景声挺不错的

本文作者Takuya分享了他如何为SaaS产品Inkdrop(一款Markdown笔记应用)吸引到首批500名付费用户的经验。Inkdrop目前拥有600名客户,月收入3200美元,定价为每月4.99美元或每年49.9美元。作者强调,成功并非依赖于大型博客的报道或广告,而是通过专注于提升现有用户满意度、口碑传播以及分享个人产品策略和经验来实现的。...

本文详细介绍了作者如何独立开发并成功运营一款名为 Inkdrop 的多平台 Markdown 编辑器,实现了每月 1300 美元的盈利。作者在东京担任自由职业者期间,利用项目制收费模式为自己争取了充足的开发时间。Inkdrop 的月收入从最初的 360 美元增长到 1361 美元,作者希望未来能以此为生。

文章的核心思想围绕着“发现痛点、构建 MVP、获取早期用户、关注可持续性、优化用户体验和营销策略”展开。作者强调,他从自身日常遇到的问题出发,开发了一款满足自己需求的 Markdown 笔记应用,该应用专注于 GitHub 风格的 Markdown 编辑、简洁美观的 UI、快速同步和离线支持。在技术选型上,作者采用了 Electron 构建跨平台桌面应用,ReactJS 用于移动版本,并利用 CouchDB 和 PouchDB 实现快速同步。...

本文由 Thorsten Ball 撰写,旨在提供关于如何进行有效产品演示的实用建议。作者强调,成功的演示不仅仅是展示产品功能,更重要的是与观众建立连接,清晰地传达产品的价值和解决的问题。文章开篇即指出,演示者应首先明确产品解决的问题及其背后的原因,从而为观众提供一个理解产品的背景和动机。

在演示过程中,作者强调了保持流畅性和同步性的重要性。他建议演示者不要自我打断,并确保口头讲解与屏幕内容保持一致,避免观众分心。时间管理也是一个核心要素,作者反复强调要“保持简短”,甚至“更短”,以避免冗余信息和观众疲劳。

为了确保观众抓住重点,作者建议演示者主动指出关键信息,例如在展示一个处理大型文件的工具时,要明确告知观众其处理能力,而不是期望他们自行发现。同时,演示中应避免展示不必要的内容,例如全屏录制时显示无关的菜单栏图标或电池电量,这些都可能分散观众的注意力。...

这个开灯/关灯的效果太酷了

又踩了一坑:在模拟器里稳定复现的 Bug,在真机上居然没有问题。更有意思的是,拿这个 "Bug" 去问两个 Coding Agents,一个个都回答地头头是道,信心满满,还不一样···

首选 Sonnet-4.5,实在解决不了再找 GPT-5-Codex,这是目前我的最佳实践。

GPT-5-Codex 和 Sonnet-4.5 真是两个极端,前者不会有任何情绪输出,非常地 Nerd(即使错了,也不会道歉),后者则是时不时找到了 Root Cause(虽然常常不是)。

有时真的会被 GPT-5-Codex 气到,花了半小时写了一小段代码,然后告诉你,你自己去 build 一下(明明已经把 build command 写在了 Agents.md 里),结果一 build,各种 error···。

相比之下 Sonnet-4.5 则是会很主动地去 build,出结果也很快,就是不怎么靠谱···

又学到了,用 Text(context.state.startDate, style: .timer) 来 update Live Activity,但显示的时间总是不能右对齐,GPT-5-Codex,Sonnet 4.5 都失败了,最后还是在 StackOverflow 找到了解决方案,加一个 modifier .multilineTextAlignment(.trailing),虽然看起来是用于修饰多行显示的,但其实单行也可以。

今天的 GPT-5-Codex VS Sonnet 4.5,前者完胜。一个 Feature,后者啰里八嗦了 10 来遍,找到了 Root Cause,改了半天,根本不 Work。前者 One Shot,直接搞定!

Vibe Coding 带来了大量的碎片时间,这些碎片时间该如何高效利用 🤔

本文作者丹尼尔·德·莱尼(Daniel De Laney)指出,自由开源软件(FOSS)领域普遍存在一个问题:许多功能强大的工具拥有“高级用户”界面,这使得普通用户望而却步,甚至放弃使用,或者不得不寻求技术人员的帮助。作者以视频转换工具Handbrake为例,说明普通用户常常因视频格式问题而感到困扰,但Handbrake复杂的界面令他们感到不适。

为了解决这一问题,作者提出了一个解决方案:为这些功能强大的工具开发一个简化的前端界面,隐藏其复杂性,只保留普通用户最常用、最核心的功能。他以自己开发的Magicbrake为例,这是一个Handbrake的简化前端,只有一个按钮,其唯一功能是将“奇怪”的视频文件转换为通用的MP4格式。作者强调,这种简化并非削弱软件功能,而是通过隐藏不常用功能,让普通用户更容易上手和使用。对于需要高级功能的用户,他们仍然可以使用原版软件。...

We've streamlined the entire RAG process. File Search automatically manages file storage, optimal chunking strategies, embeddings and the dynamic injection of retrieved context into your prompts. It works within the existing generateContent API, making it easy to adopt.

这可太方便了,一个 API 搞定一整套 RAG!

Rive 做的动画,效果还挺不错的

对舒服的 UI 毫无抵抗力···

Tweet image

把 Prompts 也录入到项目中了,感觉还不错,会 push 你去思考这次改动到底要做什么,也方便将来 Review。

Tweet image

AI Agents 有一个共同的「毛病」:过于顺从。给一个 command 后,都会想着如何去实现它,而不会反思这个 command 结合当前的 context 是否合理,是否有更优的解决方案。

为了这寸土寸金的 Context,还是把 XcodeBuild mcp 给 disable 了吧···

Tweet image

这个设计看着很舒服

Tweet image
1 / 5
Next ›