大神Karpathy用《钢铁侠》的战衣比喻AI的未来

https://mp.weixin.qq.com/s/4×3-Dai-w-SlNyTI53UfCQ

周末了，学习一下。

大神 Karpathy 在“YC AI 创业学校”的演讲，探讨了软件的演变，将其分为三个阶段：软件1.0（代码）、软件2.0（权重）和软件3.0（提示）。他将大型语言模型（LLM）比作公用事业、芯片工厂和操作系统，指出它们正在改变技术传播方式，使数十亿人能够使用。演讲还深入探讨了LLM的心理学，将其描述为具有记忆、幻觉和脆弱性的“人魂模拟器”。

软件范式的演变：从1.0到3.0

软件1.0：就是亲手写代码，一行行告诉电脑“干这个、干那个”。传统网站、手机App、操作系统内核，大部分是1.0时代的产物。特点就是代码是死的，逻辑全靠人脑设计，改 bug 也费劲，对专业技能要求也高。

软件2.0：程序员准备好数据，用算法调出“权重”，让模型自己学会干活。特点就是代码少了，数据和模型更重要。

软件3.0：就是现在这种大模型下的玩法，直接用自然语言跟AI聊天，告诉它“帮我写个程序”或“分析这条评论是正面还是负面”，AI就给你搞定。特点就是普通人也能随便编程了。

Karpathy意思就是说，现在是软件3.0时代，AI像“新电脑”，3.0让每个人都能当“程序员”。这让软件开发从少数人的游戏变成全民狂欢。

LLM：像操作系统一样的“新电脑”

Karpathy把LLM比作一种新型电脑，有点像操作系统的雏形：

LLM是CPU：处理核心，负责计算和推理。

上下文窗口是内存：短期记忆，决定模型能记住多少信息。

编程用英语等自然语言：不像传统编程语言，LLM的“程序”是用自然语言写的，门槛超低。

像Windows或MacOS，LLM有闭源（比如OpenAI）和开源（比如Llama）生态。

像1960年代的计算机，LLM计算资源昂贵，只能通过云端“分时共享”（类似API调用），个人电脑革命还没到来。

跟操作系统终端一样，直接跟LLM对话就像在命令行敲指令，图形界面（GUI）还没完全普及。

提到说「LLM像水电一样，是基础设施，OpenAI等公司花大钱训练模型（像建电站），然后通过API按使用量收费（像电费）」

LLM的“人性”：超能力与缺陷

超能力的部分：

百科全书式记忆：读过海量文本，记得比任何人都多。

多才多艺：能写代码、翻译、回答问题，覆盖各种领域。

缺陷也很明显：

幻觉：会胡编乱造，瞎说一通。

不稳定智能：某些任务超强，但会犯低级错误（例如“9.11大于9.9”，“strawberry有两个r”）。

短期记忆：上下文窗口像工作记忆，过长就忘，缺乏长期学习能力。

安全问题：容易被“忽悠”（提示注入攻击），可能泄露数据。

提到一个应对策略：利用LLM的超能力，绕过它们的缺陷。比如用清晰的提示减少幻觉，用图形界面（GUI）让人快速检查AI输出。

机会：部分自主的AI应用

Karpathy认为，LLM将催生“部分自主”应用，结合AI和人的协作。

拿编程工具Cursor举例：传统代码编辑器+LLM，人在主导，AI辅助。

搜索工具Perplexity：类似Google，但整合LLM，能做快速搜索或深度研究。有GUI显示信息来源，方便人检查，还能调整自主度。

但大佬觉得这还只是属于部分自治，我相信很多人初学者也会有这个烦恼，比如你确实用 AI 编程写了个好玩的的东西，但部署到你线上服务器，哪怕域名解析，ssl 证书申请等这些“非代码”部分AI帮不了你了，只能靠自己点来点去。这些任务需要跟外部系统打交道（像域名注册商、云服务商），AI没法直接“点按钮”或者处理复杂的GUI界面，所谓虽然代码简单了，但把想法变成真实产品（域名、部署、支付等）还是很麻烦。

短期来看AI还得靠人“擦屁股”，所谓人机协作，就是AI干粗活，人管细活。长期的话Karpathy很乐观，觉得AI会慢慢学会“点按钮”。（我们也可以和你给那些感觉到现在很多 agent 已经可以更多的自动化了，包括我在这篇文章来自Agent们的较量里测试的很多工具也能简单的自动部署了）