hutusi: 试试这个小众的社区，分享一篇刚写的博客《周刊第16期: Andrej Karpathy 讲 AI》

前一阵子有看过，借你这篇文章又回顾了一下。Andrej Karpathy 的类比还是挺到位的：

不过相比于“电网”，Andrej Karpathy 认为大模型更恰当的类比是“操作系统”。因为它不是单纯的商品，而是生态的核心。像操作系统一样，大模型有开源也有闭源，有很多家提供厂商，最终可能会演进成少量的几个生态。LLM本身就像是CPU，上下文窗口则像内存，大模型应用通过调度这种“CPU”和“内存”来解决问题。

这段话的描述太到位了，好像是这样的。

我们现在部署大模型的资源成本很高，这很像1960年代的大型机时代，所以大模型都被集中部署在了云端，用户只能够通过API来调用它，就像当年要使用瘦客户端去接入大型机一样。没有人能独享大型机，所以产生了分时技术，而今天我们对大模型的使用如出一辙。大模型的PC（个人电脑）时代还没有到来，从目前的经济性来看还不允许，但未来会是这个趋势。另外，我们与大模型的交互通过 ChatBox 的文本交互，这也很像计算机时代初期只能通过终端命令行进行交互，属于大模型的通用 GUI（图形界面）交互方式还没有被发明出来。

可能 10 年后，智能程度达到 GPT-4（甚至以上）的 AI 已经可以在端侧运行了。说起来 Jony Ive 和 Sam Altman 在做的 AI 时代的新设备会不会是运行这个「操作系统」的更好的载体？

实际上，在真正的业务场景，并不是大模型越自主越好。AI太过主动，有时反而会拖慢效率。就像钢铁侠的战衣一样，它具备自主执行任务的能力，但更多的场景，是斯塔克在操作着它。在当下大模型还不完善的情况下，半自主Agent是比较合适的选择。

我现在的策略是 Side Project 可以让它自由发挥，Biz Project 还是得自己主导。