Andrej Karpathy: Software Is Changing (Again)学习笔记 By Jackywine

朋友们好哈

最近 AK 大神在 YC 的 AI startup 上的演讲确实让人眼前一亮,讲的是软件如何再一次改变,下面记录一下我的学习笔记

在这里插入图片描述

AK 是谁?

AK 老师的个人网站: https://karpathy.ai/
请添加图片描述

  • 个人经历:1986 年 10 月出生于斯洛伐克的布拉迪斯拉发
    在这里插入图片描述
  • 15 岁随家人搬到加拿大多伦多。
    在这里插入图片描述

2009 年在多伦多大学获得计算机科学和物理学学士学位,2011 年在不列颠哥伦比亚大学获得硕士学位,之后进入斯坦福大学攻读博士学位,师从李飞飞
AK 老师的老师
2015 年获得博士学位。

  • 职业经历:2015 年,作为创始团队成员加入 OpenAI 担任研究科学家,负责生成模型的深度学习和深度强化学习。2017 年,受马斯克邀请加入特斯拉,接替 Chris Lattner 担任特斯拉人工智能和自动驾驶视觉总监,后被提为特斯拉 AI 高级总监,2022 年 7 月从特斯拉离职。2023 年 2 月 9 日,宣布再次加入 OpenAI。2024 年 7 月,创办 Eureka Labs,旨在建立一所 “人工智能原生” 的学校。

  • 学术成就:学术主要专注于卷积 / 循环神经网络及其在计算机视觉、自然语言处理及其交叉方面的应用。他亲自设计了斯坦福大学第一门深度学习课程
    在这里插入图片描述

CS231n:用于视觉识别的卷积神经网络》并担任主要讲师,其课程视频观看量超过 80 万次。他还曾在 2014 年获得国际计算机视觉会议(ICCV)的 Longuet - Higgins 奖最佳论文奖,2015 年在国际计算机视觉会议(ICCV)上获得 Marr 奖荣誉提名,2016 年获得美国总统早期职业科学家和工程师奖(PECASE),2017 年被评为《麻省理工科技评论》35 岁以下创新者之一

  • 人物评价:被马斯克视为会成为 “全球最顶级的 AI 领袖” 人选,在人工智能领域受到广泛尊重,其研究成果对推动神经网络和人工智能技术的发展起到了重要作用。

如何学习他的演讲?

在这里插入图片描述

以下一些我认为比较重要的要点,强烈建议你直接看源视频

大神Andrej Karpathy最新演讲:AI时代的软件

他的演讲本质:LLM 从工具到基础设施的过程

软件到底经历了什么?

SW(software)1.0

纯手打代码,主要是告诉计算机 how,属于 Github 的时代到来了

SW2.0

玩的是 Weight(权重),需要的是数据+优化,属于 Hugginface 的时代到来了

SW3.0

带有大型知识库的神经网络变得“可编程”产品可以使用自然语言构建了,自然语言+代码就是新的编程范式

Vibecoder =用 自然语言编程的人:

在这里插入图片描述
在这里插入图片描述

关于 Vibecoding ,你可以查看我之前的认识: 什么年代了你还不知道Vibecoding by karpathy

和实践: [1000 JVCP] Jackywine 和他的 1000 个 Vibe Coding 项目

很好,你现在认识到你所处的时代是 SW3.0 时代了

这个时代的特点就是 LLM成为了新型的基础设施,就像电力一样

用一个表格,更好的帮助你理解这个时代:

分类维度具体内容类比对象现状与趋势Jackywine 思考
基础设施属性:类公用事业的AI服务1. 服务模式:LLM实验室训练模型后通过API按token计费提供服务2. 调度工具:Open Router实现模型切换3. 全球影响:顶尖LLM宕机引发“智能停电”1. 发电站(AI能力生产)2. 电力调度系统(能源切换)3. 电力基础设施(社会依赖度)AI服务成为数字经济基础,依赖度接近传统公用事业(没有 LLM 就没有电,整个社会没有电就没法动,没有 LLM 就没法思考)
技术壁垒:类操作系统的生态竞争1. 市场格局:闭源(GPT系列)与开源(LLaMA生态)并存2. 硬件矛盾:云端集中部署为主,本地轻量级模型探索中1. 操作系统市场(Windows/macOS与Linux)2. 1960年代大型机(集中计算)开源生态处于早期,个人LLM计算尚在萌芽阶段(未来就像电脑和手机一样,每个人都有专属的几个 LLM)
交互范式:从终端到GUI的进化缺失1. 交互现状:以文本指令(类似终端)为主2. 优化案例:Cursor编辑器通过可视化界面提升效率终端命令行(文本交互)跨场景通用GUI尚未形成,特定工具局部优化(这里是 Jackywine 觉得 UIUX 设计师的机会)(Cursor 就像给命令行增加了鼠标和一小部分窗口 GUI)

最让我觉得脑洞大开的实际上是这个框架图,详细清楚的解释了 LLM 是以及为什么它是操作系统

在这里插入图片描述
未来的计算机请按照此架构进行打造

在这里插入图片描述

Cursor 就是一个传统 GUI 结合 LLM 特别好的案例,好到以至于很多人觉得 LLM 应用本应该如此,有一种本能的美感

关于 LLM 心理学部分,我不感兴趣,我不放了

LLM 应用实践方向

部分自主到 Agent 生态

Cursor 就是一个很好的案例,用户通过 GUI 而非和 chatGPT 一样的文本对话来进行操作,GUI 大幅度降低用户的认知负担,今后的其他应用,一定会有更加丰富和可定制化的 GUI,这是一定的

LLM 做重复工作,而不是人类去做,人类专注于决策与验证 LLM 的产出,最后形成 AI 生成+人类把关的流程,而不是一脚踹在我们这些人的屁股上把我们踢出去

AK 拿钢铁侠做类比:

我们要做的是:
在这里插入图片描述
我们不要做的是:

在这里插入图片描述

你公司的文档,有没有适配 Agent?

我们知道很多应用为了帮助人类上手会写Document,但是未来会有越来越多的 LLM Agent,如何更好的教会这些 LLM 学会你的产品和工具?

可以参考:Stripe 和 Cell 把文档变成适合大模型阅读和整理的纯文本,类似指引爬虫的 Robot。txt(只不过这玩意防君子不防小人啊)

Vibecoding 从入门到收款赚钱中间隔着无数关卡,但是jacky相信这是机会

在这里插入图片描述

除了对着 AI 一顿输出外,你还需要了解的是(中国版):

LLM API(用 Deepseek?)

AI 生图(用豆包?)

本地运行(最简单,也是最多 Vibecoder 满足的地方,不要满足于此)

部署到 Vercel(国内替代我还在寻找)

买域名(困难模式)

搞备案(地狱模式)

身份验证(困难模式)

支付(困难模式)

最后你还需要判断你的产品目标市场是国内还是海外

Vibecoding 刚刚火起来,到能够落地变成真实可用的产品还有一截路

由于 AK 之前做汽车自动驾驶的,新技术的落地在这种对于技术安全要求高的领域往往就是需要很久,但是目前来看 Vibecoding 同样也需要很高的技术安全要求,现在你去任何网站搜索 Vibecoding,基本上都是梗,但是我相信 Vibecoding 绝对是未来

未来需让 Agent 接管这些 “非代码工作”,实现真正的 “自然语言全流程开发”!!
在这里插入图片描述

劳斯!对不起劳斯!这个图太好笑了

Vibecoding 对于教小朋友来说还是很有前景的

让孩子们从出生就意识到“他们可以创造任何事情”

这件事的威力会越来越强,后面我们培养孩子们的方式应该侧重于“想法”而非“记忆”,未来的孩子们一定会更加优秀

所有的代码都值得 AI 重写一遍

对于所有看到这里的友友来说,你要做的就是:能描述清楚需求

如果你学有余力,可以学学古法传统编程

如果你学还有余力,可以学学模型微调

上面三个加起来,在 2025-2035 这个 Decade of Agent 的时代,你绝对会拥有核心竞争力!

学习,最重要的是你的想法

我只记录反直觉的观点

我只记录我强烈认同的观点

我不把翻译直接放上当做学过

我不提供翻译和播客,如果大家有需要,可以看看乔木老师的总结:

重点是学方法:

用AI工具3步学Andrej Karpathy的YC演讲精华

AK 在YC的演讲学习资料大全

参考资料:

演讲源

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值