这个月才刚过一半,Copilot 300 Requests 的份额就快用光了,感觉得开启 GLM 4.6 了。

看来还是要开启 Plan Mode,尤其是对于有一定复杂度的 Feature

这个 Timeline 的效果挺不错的,还是开源的

同一个需求分别让 Copilot、Codex 和 Claude Code 来实现,最后是 Claude Code 在第三次完整地实现了。Copilot 和 Codex 都失败了,其中 Codex 更是辛辛苦苦做了 20 分钟,最后拉了坨大的,给了反馈后,也调整不好,属于班里那种非常勤奋,但成绩又不拔尖的同学。

目前的 Coding Agent 不论多高级,都有一个共性:在实现一些 Feature 或修复 Bug 时会 "hit wall",而只靠它自己是没有能力解决的。此时必须依靠有经验、有能力且对项目有足够了解的程序员介入,才有可能找到解决方案。这也是为什么中高级程序员短期内不仅不会失业,还会变得更有价值的原因(之一)。

Sonnet 4.5 在尝试实现一个 Feature 时,发现可能带来的改动量比较大,索性就罢工了,这是一种进步还是退步,我竟一时分不清了···

The app is now back to its original, working state. The page-scrolling implementation would require a fundamentally different architecture (like using UIPageViewController or a more complex custom solution), which would be quite invasive to the current codebase.

原来这里还有一个小按钮,可以 copy 选定的动画效果

Tweet image

iOS 26 的 ToolbarItem 会自动被包一层 glass button,还没有办法去掉,同时要想实现分开的两个 button,不能简单的罗列两个 ToolbarItem 或者 HStack ,只能通过 iOS 26 新增 ToolbarSpacer 来实现...

AI Coding Agent 还有一个很严重的问题:不可靠性。有时很聪明,有时又会犯傻。所以还是要多几个工具,当其中一个掉队时,另一个可以顶上。

这篇文章详细阐述了作者Mitchellh如何利用AI作为主要辅助工具,开发Ghostty终端的非侵入式macOS自动更新功能。他分享了一个高度迭代的过程,包括前期人工规划、AI进行UI原型设计、代码清理、文档编写和模拟测试。文章强调,尽管AI在处理明确任务和提供灵感方面表现出色,但在面对复杂bug或生成次优代码时,人工的战略性调整、深入理解、重构和严格审查至关重要。整个项目耗时约8小时,花费15.98美元,作者认为AI加速了开发,尤其是在处理繁琐的UI样式方面,并允许他在AI工作时进行多任务处理,但始终坚持人工的最终审查和主导作用。

it's important that I review a plan before it goes off and does a ton of work....

初步试用了下 spec-kit,是挺强大、方便的,就是有点费 Token···

这篇文章批评了苹果iOS 26操作系统中引入的“液态玻璃”视觉语言,认为其过度强调视觉设计和装饰性UI效果,却牺牲了可用性。作者指出,半透明元素导致内容难以辨认,动画按钮分散用户注意力,缩小和拥挤的触控目标增加了操作难度,而不断变化的界面和对既有约定的打破则损害了可预测性和可发现性。文章总结道,iOS 26将视觉奇观置于用户体验之上,使得界面混乱、难以阅读且缺乏一致性,最终让用户感到沮丧,而非提供无缝的内容访问。

Claude Sonnet 4.5 is Awesome!

同样一个 bug,Codex (gpt-5-codex) 思考了两轮,每轮大概 10 分钟,都没有找到 root cause,Sonnet 4.5 一下就找到了(用的 Github Copilot),结合 Claude Code 应该会更强。

现在用的最多的两个 MCP:context7 / XcodeBuild

对于商业化的项目,在实现 Feature 这块,最好把 AI Agent 当作一个 Coding Partner,把每一个 Task 拆分地足够细,既减少了自由发挥/出错空间,也方便 Review。

经过几天调研,目前对这个 Xcode 目录结构比较满意。

  • 每一个目录职责清晰。
  • 尽量保证 co-location。
  • Shared 部分为独立、会被多处引用、支持性的模块。
  • Shared 部分稳定后可以单独拿出来作为 Package。...

Kickstater 的 ViewModel 设计的蛮有意思的,通过 inputsoutputs 来显式地标记 command 和 result。

定义 ViewModel...

如果要学习

作者是 Vercel 的设计工程师,这个付费教程旨在帮助你设计出让人愉悦的交互,页面设计得很赞,相信教程质量也不会差。

Neal 同学又放出了新的作品,把验证码坐成一个合成类游戏,看着挺好玩的样子

钟颖退出 Twitter 后,原来做了好几款开源的 Mac App,太赞了,想学习 Mac 开发的话,值得一看。

  • making sure your animations have a purpose.
  • Think about what the user wants to achieve and how often they will see an animation.
  • Unless you are working on marketing sites, your animations have to be fast.

12 个动画设计原则,对于创造 delight 的体验,挺有帮助的。

这个 site 的设计挺有自己的风格和理念的

这个关于 Server / Serverless / Fluid 的区别的 Visualization 做得太棒了!

可以在这里体验。这个工具本身是通过 v0.dev 生成的

好喜欢这种功能单一、设计简洁的工具

这个 Date Picker 感觉可以成为标准了,功能强大的同时操作也挺方便的。

虽然 Raycast 内置了 Caffeinate 功能,虽然系统提供了 caffeinate cli,但还是有很多人不用 Raycast,更不用说 cli 了。把一个实用的小功能做到极致,用户是愿意买单的。

Tweet image

用这个工具搜索 GitHub 代码,真的是快的飞起!

发现了一个高效的编程领域的学习模式:找到一个优秀的开源项目,然后让 GitHub Copilot 成为那个无处不在的老师。这里选择 Copilot 而不是 Claude Code 的一个原因是:更好的 Markdown 渲染结果和与 IDE 交互的友好性。

这个模式看起来可以推广到更广义的学习范畴:一份优秀的手册、文档、课件、代码加上一个优秀的 Agent(能够识别、生成足够好的 Context,优化过的 Output 等等)。

一个可以在 iOS 设备上开发 iOS 应用的应用,交互方式主要是 Chat,有点像把 CC 移植到了 iOS 上,挺 magic 的。我其实蛮想要一个 Mac 平台的,类似这样的工具。

这是一篇来自淘宝团队,讲解提示词工程(PE)非常全面的文章,包含业界各类优秀方法论。

文章详细介绍了提示词的四大构成要素(背景信息、指令、输入数据、输出指示器),并总结了七项黄金设计原则,包括清晰具体、赋予角色、提供示例、分解任务、使用分隔符、明确约束和持续迭代。主流框架如RTF、CO-STAR和CRITIC为提示词设计提供了结构化模板。高级技巧如思维链(CoT)、自我一致性、ReAct等进一步提升模型性能。

作者回顾了 Paul Graham 提出的“做那些无法规模化的事”理念,并结合自身经历,提出在 GPT 等AI工具的帮助下,个人或小团队可以轻松构建满足自身需求的小项目,无需追求大规模扩展。作者以自己运营的 Slack 社区、PostcardMailer 项目和为母亲开发的电话提醒应用为例,说明了小规模、定制化的产品往往更能保持亲密感和实用性。

AI工具降低了开发门槛,让“为自己或身边人服务”成为一种新常态。作者认为,真正的奢侈不是速度或成本,而是有能力停下来,享受“小而美”的成果,而不是被扩张和规模化的压力所驱使。

分享一个自己一直在用的用来快速了解文章内容/YouTube的 prompt:

markdown
请分析给定内容,并分成三部分。每部分都应该简洁、准确,不要遗漏重要内容。请使用 Markdown 格式回复:

### 摘要
请控制在 500 字左右。

### 内容精简
请将内容进行精炼和概括,形成一篇完整且易于理解的文章,同时确保没有遗漏任何要点。
- 按照主题来梳理,每个主题以 `### 主题` 作为标题,要求
- 每个小节都需要根据文中的内容详细展开,让我不需要再二次查看原文了解详情,每个小节不少于 500 字。

### 问答
请列出有助于理解本文的要点问答。答案应清晰简洁。

Internet Phone Book - 有意思的纸质年刊,有新时代《whole world catalog》的感觉

Hundred Rabbits - 最酷的数字产品手工艺 couple

产品沉思录 by Flomo 的少楠

如果想实现 local first web app, https://linear.app 是个很好的参考

改版了,我之前发的消息找不到了咧😂

几家 AI Providers 一段时间用下来,现在 Default 都是找 Gemini 2.5 Pro,ChatWise 也很少打开了,就是在生成图这一块还差 ChatGPT 一大截。

沉浸式翻译的最佳替代品是?

这个 TTS 的效果也太好了吧···,用来做播客很方便,价格也不贵。

Anthropic 分享了他们构建多智能体研究系统的经验,该系统利用多个协同工作的 AI 智能体来更有效地探索复杂主题。该系统的核心是一个“编排者-工作者”(Orchestrator-Worker)架构,由一个“领导者”(Lead Researcher)智能体负责规划和分解任务,并将子任务分配给多个并行的“子智能体”(Subagents)。这种方法的主要优势在于能够并行处理信息,有效管理大型上下文窗口,从而处理超出单个模型能力范围的复杂、广泛的查询。

更细致的拆解可以参见:https://g.co/gemini/share/c26b508c052e

这篇文章描述了通过 Contextual Retrieval 来提升检索增强生成(RAG)系统检索信息的能力。传统的 RAG 系统在处理文档时,会将其拆分为小文本块,这个过程中常常会丢失关键的上下文信息,导致检索失败。情境检索通过在每个文本块前添加由大型语言模型(如 Claude)生成的、概括其在文档中上下文的简短说明,来解决这个问题。

拆解后的内容可以见:https://gemini.google.com/share/d53247d80b86

通过免费的高质量的课程来吸引注册,然后这些用户就可以成为下一个产品的潜在目标群体,去进行推广,这个模式好像也不错。

Holy moly, this is good!

这个确实挺接近我理想的 Focus App,不需要强制设置干活多久,休息多久,同时还可以记录 session 的一些 note

一个通过 Chat 来操控浏览器的插件,特定场景下还挺方便的。

这个工具太棒了,跟苹果设备相关的尺寸几乎都包含了,从设备,到 icon,甚至连 widget 的 size 也有,还很贴心地敷上了每个设备的发售日期。

原来沉浸式翻译的 BabelDoc 是开源的,太棒了。看了下实现思路,也是通过 PyMuPDF 来提取页面元素,再结合 nougat 和一些 post rendering 来做文档解析和视觉结构识别。