35MM.COFFEE

分类

标签

Profile
hutusi

25 天前

试试这个小众的社区,分享一篇刚写的博客《周刊第16期: Andrej Karpathy 讲 AI》

limboy

limboy

25 天前

前一阵子有看过,借你这篇文章又回顾了一下。Andrej Karpathy 的类比还是挺到位的:

不过相比于“电网”,Andrej Karpathy 认为大模型更恰当的类比是“操作系统”。因为它不是单纯的商品,而是生态的核心。像操作系统一样,大模型有开源也有闭源,有很多家提供厂商,最终可能会演进成少量的几个生态。LLM本身就像是CPU,上下文窗口则像内存,大模型应用通过调度这种“CPU”和“内存”来解决问题。

这段话的描述太到位了,好像是这样的。

我们现在部署大模型的资源成本很高,这很像1960年代的大型机时代,所以大模型都被集中部署在了云端,用户只能够通过API来调用它,就像当年要使用瘦客户端去接入大型机一样。没有人能独享大型机,所以产生了分时技术,而今天我们对大模型的使用如出一辙。大模型的PC(个人电脑)时代还没有到来,从目前的经济性来看还不允许,但未来会是这个趋势。 另外,我们与大模型的交互通过 ChatBox 的文本交互,这也很像计算机时代初期只能通过终端命令行进行交互,属于大模型的通用 GUI(图形界面)交互方式还没有被发明出来。

可能 10 年后,智能程度达到 GPT-4(甚至以上) 的 AI 已经可以在端侧运行了。说起来 Jony Ive 和 Sam Altman 在做的 AI 时代的新设备会不会是运行这个「操作系统」的更好的载体?

实际上,在真正的业务场景,并不是大模型越自主越好。AI太过主动,有时反而会拖慢效率。就像钢铁侠的战衣一样,它具备自主执行任务的能力,但更多的场景,是斯塔克在操作着它。在当下大模型还不完善的情况下,半自主Agent是比较合适的选择。

我现在的策略是 Side Project 可以让它自由发挥,Biz Project 还是得自己主导。