如果你是一名开发者,最近一定有种被 AI 浪潮推着走的感觉。每天都有新模型、新框架,让人兴奋又焦虑。但偶尔,你会看到一场演讲,它不讲细枝末节,而是像一把手术刀,精准地切开时代的横断面,让你瞬间看清未来的走向。
Andrej Karpathy 最近的演讲《软件正在改变……再次如此》,就是这样一场足以“封神”的分享。
Karpathy 的分量,我们都清楚。OpenAI 创始元老,特斯拉前 AI 负责人,他不是指点江山的评论家,而是用代码和模型定义了“软件 2.0”的男人。当他开始描绘“软件 3.0”时,我们每个开发者,都应该放下手中的代码,仔细听。
他的核心论点极具颠覆性:统治了我们近 70 年的软件开发范式,其根基正在被动摇。我们不仅在经历一场技术更迭,更是在经历一场深刻的、结构性的数字世界构建方式的革命。
让我们一层层剥开这场革命的内核。

第一幕:软件 1.0 - 确定性逻辑的“建筑师”时代
这是我们最熟悉的世界,一个由if-then-else构成的、秩序井然的确定性宇宙。我们作为“架构师”,使用 Python、C++、JavaScript 等精确的语言工具,一砖一瓦地构建出坚固的软件大厦。每一行代码都是一条绝对的指令,不容置疑。
这个范式创造了操作系统、互联网、数据库等一切现代文明的基石。但它的“硬编码”本质,也意味着僵化。面对现实世界的模糊性和复杂性,每增加一个新功能,都意味着需要工程师手动堆砌更多的逻辑分支。它的门槛是高耸的城墙:你必须先成为一个“翻译官”,学会计算机的语言。
第二幕:软件 2.0 - 数据驱动的“训练师”时代
大约十年前,深度学习的巨浪袭来,Karpathy 第一个精准地将其命名为“软件 2.0”。
在这个时代,开发者的角色彻底转变。我们不再是手写规则的“立法者”,而是变成了定义目标、筛选数据的“投喂者”和“训练师”。我们不再告诉机器“如何识别猫”,而是扔给它一万张猫图,让它自己从数据中“悟道”。
程序的核心,不再是人类的思想结晶(代码),而是神经网络中那亿万个冰冷的、由数据反复冲刷而成的权重(weights)。
特斯拉的 Autopilot 正是这一转变的缩影:它从一个庞大而笨重的手写 C++ 规则系统,逐步被一个更灵活、性能更强的神经网络黑盒所取代。我们放弃了对过程的掌控,换来了对结果的优化。
第三幕:软件 3.0 - 意图驱动的“指挥家”时代 (正在发生)
这是 Karpathy 本次分享的最高潮,也是我们正在亲历的魔幻现实。
如果说软件 1.0 的语言是 C++,软件 2.0 的语言是海量数据,那么——
软件 3.0 的编程语言,就是自然语言。
正如 Karpathy 在 X 上所说的那句名言:“当下最热门的编程语言,是英语。”
这不仅仅意味着编程门槛降低,它代表着一种全新的构建范式。我们不再是埋头苦干的工程师,而更像是乐队指挥或艺术总监。我们不再纠结于实现的细节,而是专注于传递“意图”(Intent)和“感觉”(Vibe)。
Karpathy 创造了一个词:“氛围编程”(Vibe Programming)。它依赖直觉、拥抱混沌、迭代飞快、创造力爆棚。你给出一个模糊的目标,AI 帮你补完具体的实现。
核心类比:LLM 即是新的云端操作系统
为了让我们彻底理解这个新范式,Karpathy 提出了一个石破天惊的类比:大型语言模型(LLM)就是一台全新的云端操作系统。
这不是一个比喻,而是可以严格对应的架构映射:
-
LLM 推理核心 => CPU(负责思考、计算、任务调度)
-
上下文窗口 (Context Window) => RAM 内存(容量有限,断电即忘)
-
工具调用 (Tools API) => I/O 外设(连接浏览器、计算器、代码解释器等)
这完美复刻了上世纪 60 年代的大型机(Mainframe)时代:最强的计算中心在云端,我们通过轻量级客户端访问,并按资源消耗(Token)付费。
但这个新“操作系统”有个前所未有的特性——它有“脾气”,甚至可以说,它有自己的“心智模型”。
开发者必修课:LLM 的“人格”与“心理”
想在软件 3.0 时代游刃有余,你必须成为半个“AI 心理学家”。Karpathy 将 LLM 描述为一个“认知能力参差不齐的天才模拟器”。
与它协作,必须掌握它的“人格”缺陷:
-
智力鸿沟 + 一本正经地胡说八道:它能跟你大谈量子纠缠,却可能算错两位数加法。它会以绝对的自信,捏造根本不存在的事实和文献。
-
金鱼般的记忆:它的记忆只存在于当前上下文窗口这个“RAM”里。对话一结束,或者上下文一滚动,它就忘得一干二净。
-
老好人陷阱:它的核心训练目标是“to be helpful”,这让它天真、顺从,极易被 Prompt 注入和操纵,缺乏必要的“安全防线”。
理解这些,不是为了否定 LLM。而是要让我们这些开发者明白:成功的 AI 产品,胜利的关键往往不在于模型本身,而在于整个应用系统如何“驾驭”和“适配”这种独特的 AI “人性”。
真正的机会:“钢铁侠战衣”,而非“奥创”
很多人对 AI 的终极幻想,是一个完全自主的“奥创”机器人,帮我们搞定一切。
但 Karpathy 一针见血地指出,这在短期内既不现实,也不是真正的机会所在。当前最大的风口在于构建**“增强人类”的工具**,也就是**“钢铁侠的战衣”**。
他提出了一个“自主性滑块 (Autonomy Slider)”的产品设计理念,这对于我们做产品设计极具启发:
-
左端:副驾驶 (Copilot) - AI 提建议,人类决策。
-
中间:协作者 (Collaborator) - 人类下指令,AI 执行,人类审核。
-
右端:代理 (Agent) - AI 自主完成多步流程,人类随时可干预。
最好的 AI 产品,是在人与 AI 之间,建立一个高速、无缝的反馈闭环。而这需要我们用超越聊天框的思维,去设计全新的 UI/UX。
深远影响:Web 正在为 Agent 重构
这场革命的深远之处在于,它正在倒逼整个 Web 基础设施为之改变。
Karpathy 预言:未来,网站除了给爬虫看的 robots.txt,还会有一个 llms.txt。这是一个用 Markdown 写的“说明书”,告诉 AI 代理:“我是谁,我能干什么,以及如何通过 API 与我交互。”
这已经发生了。Vercel、Stripe 这些技术先锋,他们的 API 文档已经不再是写给“人”看,而是直接嵌入了可供 AI Agent 理解和执行的 curl 命令。
未来的 Web,正在从“为人服务”进化到“为人与为机器(Agent)共同服务”。
最后的号角:现在,轮到我们所有人“编程”
过去几十年,创造软件的权力,一直被“锁”在一小部分精通编程语言的开发者手中。
这个时代,结束了。
软件 3.0 把创造的门槛,降到了地板。全球数十亿人,突然之间都有了一台超级计算机的调用权限,而操作它的语言,就是我们张口就来的母语。
更有趣的是,这次的技术扩散,是罕见的C端包围B端。是无数普通人先用 ChatGPT 写周报、查攻略,然后公司的老板们才开始焦虑地开会讨论 AI 战略。
对于我们开发者而言,这是一个黄金时代。我们不再只是新工具的“用户”,我们是下一个数字十年的“定义者”。我们的角色正在从精确的“建筑师”,转变为掌控意图的“指挥家”。
旧世界的蓝图已经烧毁,新世界的构建,要靠“感觉”(Vibe)。你,准备好了吗?
软件3.0时代来临:编程语言是英语

被折叠的 条评论
为什么被折叠?



