GPT-4里套娃LLaMA 2!OpenAI创始成员周末爆改「羊驼宝宝」,GitHub一日千星

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

大神仅花一个周末训练微型LLaMA 2,并移植到C语言

推理代码只有500行,在苹果M1笔记本上做到每秒输出98个token

作者是OpenAI创始成员Andrej Karpathy,他把这个项目叫做Baby LLaMA 2(羊驼宝宝)。

7eaba5f02aef1e7cd7cae587875d543b.png

虽然它只有1500万参数,下载下来也只有58MB,但是已经能流畅讲故事。

f4544c73130d8290a0487af80e421842.png

所有推理代码可以放在C语言单文件上,没有任何依赖,除了能在笔记本CPU上跑,还迅速被网友接力开发出了各种玩法。

llama.cpp的作者Georgi Gerganov搞出了直接在浏览器里运行的版本。

a83ed72d8bff24e7f90625ca02ceb7d4.png

提示工程师Alex Volkov甚至做到了在GPT-4代码解释器里跑Baby LLaMA 2。

f67bf040d4d4ccc1bb8fadad691eb138.png

大模型套娃小模型,成了。

羊驼宝宝诞生记

据Karpathy分享,做这个项目的灵感正是来自llama.cpp。

训练代码来自之前他自己开发的nanoGPT,并修改成LLaMA 2架构。

推理代码直接开源在GitHub上了,不到24小时就狂揽1500+星。

6ea195c1e74fd33afbf7ca7939865eb3.png

训练数据集TinyStories则来自微软前一阵的研究。

2023新视野数学奖得主Ronen Eldan、2023斯隆研究奖得主李远志联手,验证了1000万参数以下的小模型,在垂直数据上训练也可以学会正确的语法、生成流畅的故事、甚至获得推理能力。

4f6118e6e69da17f3d06e2da8bda3ef9.png

此外,开发过程中还有一个插曲。

Karpathy很久不写C语言已经生疏了,但是在GPT-4的帮助下,还是只用一个周末就完成了全部工作。

71fa62a857f7ad50e1d000ecccf0a7d5.png

对此,英伟达科学家Jim Fan评价为:现象级

5bb39fd2039417fa2456c712ce5a8c66.png

最初,在CPU单线程运行、fp32推理精度下,Baby LLaMA 2每秒只能生成18个token。

在编译上使用一些优化技巧以后,直接提升到每秒98个token。

13273b6bddf2441f011e632b4377eb98.png

优化之路还未停止。

有人提出,可以通过GCC编译器的-funsafe-math-optimizations模式再次提速6倍

985e566749d6a7f793533d9d4662e8bc.png

除了编译方面外,也有人提议下一步增加LoRA、Flash Attention等模型层面流行的优化方法。

742709ce8fab8a9a9b967d22ee2db571.png

Baby LLaMA 2一路火到Hacker News社区,也引发了更多的讨论。

f16729c2b34b0337ebc3aca187d4bb46.png

有人提出,现在虽然只是一个概念验证,但本地运行的语言模型真的很令人兴奋。

虽然无法达到在云端GPU集群上托管的大模型的相同功能,但可以实现的玩法太多了。

68cfaa4e56c256b58bfedbf7705a3a34.png

在各种优化方法加持下,karpathy也透露已经开始尝试训练更大的模型,并表示:

70亿参数也许触手可及。

cef220d7ff69551fbe88b569f254e23d.png

GitHub:
https://github.com/karpathy/llama2.c

在浏览器运行Baby LLaMA 2:
https://ggerganov.com/llama2.c

参考链接:
[1]https://twitter.com/karpathy/status/1683143097604243456
[2]https://twitter.com/ggerganov/status/1683174252990660610
[3]https://twitter.com/altryne/status/1683222517719384065
[4]https://news.ycombinator.com/item?id=36838051

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值