Nicholas Carlini是谷歌DeepMind的一位研究科学家,近日,他撰写了一篇长达8万字的文章,介绍自己是怎么使用AI的。
他详细列举了自己日常使用AI的50个实例,而且说这些只是他所有AI应用的不到 2%。
文章地址:https://nicholas.carlini.com/writing/2024/how-i-use-ai.html
一开篇,Nicholas就亮出了自己的观点:「我不认为AI模型(LLM)被过度炒作了」。
他承认AI泡沫的存在——「许多公司喜欢说自己『正在使用人工智能』 ,就像他们以前说自己由『区块链』驱动一样」。
但是,Nicholas认为AI所取得的进展可不仅仅是炒作。
因为在过去的一年里,他每周至少花几个小时与各种大语言模型进行交互,这些大语言模型能够胜任越来越困难的工作。
有了这些模型,Nicholas在研究项目和副业项目中编写代码的速度至少提高了 50%。
以下就是Nicholas使用LLM的几个实例——
-
用他从未使用过的技术构建整个网络应用程序
-
让模型教我如何使用以前从未使用过的各种框架
-
将数十个程序自动转换为C语言或Rust语言,将性能提高10-100倍
-
缩减大型代码库,大幅简化项目
-
为他去年撰写的几乎每一篇研究论文编写初始实验代码
-
将几乎所有单调的任务或一次性脚本自动化
-
在帮助他设置和配置新软件包或项目时,它几乎完全取代了网络搜索
-
约50%的网络搜索被取代,以帮助他调试错误信息
Nicholas将这些例子分为了两大类,一类是「帮助我学习」,另一类是「自动化无聊的任务」。
这些应用可能并不花哨,因为它们都来自于Nicholas完成实际工作的需要,就像我们一样——每天所做的大部分工作并不迷人。
但LLM的魅力正基于此:自动化完成那些工作中boring的部分。
作者背景
有一点很重要,Nicholas特别写在了前面,他自己并不是一个乐于相信新技术的人。
尽管他经历了十年前安全界的加密炒作,但他没有写过关于区块链的任何一篇论文,也从未拥有过比特币,「它们基本上没有任何用途,除了赌博和欺诈」。
除此之外,Nicholas作为一名安全研究员,近十年来,他的日常工作就是向人们展示人工智能模型在面对未经训练的环境时会以何种方式惨遭失败。
他已经证明,对机器学习模型的输入稍加扰动,就能让它们产生大错特错的输出。
或者,大多数机器学习模型都会记住训练数据集中的特定示例,并在你使用它们时重复这些示例。
所以,他完全理解这些系统的局限性。
然而,Nicholas毅然决然地宣称「大语言模型为我的工作效率创造了自互联网诞生以来的最大提升」。
如何使用语言模型
构建完整的应用程序
去年,Nicholas做了一个「GPT-4能力预测挑战赛」的小游戏,共设置了28个由易到难任务,让人们逐步预测GPT-4成功解决它们的概率。
GPT-4能力预测挑战赛
结果很受欢迎,页面浏览量超过了一千万。你猜怎么着?整个应用程序的初始版本几乎全部是GPT-4编写的。
Nicholas是通过一系列的问题来完成的,从询问应用程序的基本结构开始,然后慢慢建立各种功能。
这段对话总共长达3万字,真正凸显了GPT-4 (当时最先进的)原始模型的能力。
语言模型擅长解决人们以前解决过的问题,而这个测验99%的内容都是一些基本的HTML和Python网络服务器后台,世界上任何人都可以写出来。
这个测验之所以有趣,人们之所以喜欢,并不是因为它背后的技术,而是因为测验的内容。因此,将所有枯燥的部分自动化,让Nicholas制作这个测验变得非常容易。
Nicholas说,事实上,如果没有语言模型的帮助,他可能就不会做这个测验。因为他自己没有兴趣花时间从头开始编写整个网络应用程序。
作为新技术的导师
一个人一天只有这么多时间,而且由于工作原因,Nicholas大部分时间都花在了解最新的研究进展上,而不是JavaScript框架。
这意味着,当需要在他的特定研究领域之外启动一个新项目时,他通常有两种可能的选择。
首先,可以利用已经知道的知识,这些知识往往已经过时一二十年,但如果项目规模较小,往往已经足够。
或者,可以尝试学习新的(通常是更好的)做事方法。
这就是LLM的用武之地。
因为像Docker、Flexbox或React这样对Nicholas来说很新的框架/工具,对其他人来说并不陌生。
世界上可能有数以十万计的人对这些东西都了如指掌,这也就意味着当前的语言模型也是如此。
今年早些时候,Nicholas正在构建一个LLM评估框架,希望能够在一个封闭的环境中运行LLM生成的代码,这样它就不会随意删除他电脑上的文件或类似的东西。
Docker是完成这项任务的完美工具,但他以前从未使用过。
重要的是,这个项目的目标并不是使用Docker,Docker只是实现目标所需的工具。
Nicholas想要的只是了解他所需要的10%的 Docker,这样他就能确信自己正在以最基本的方式安全地使用它。
如果是在上世纪 90 年代做这件事,Nicholas基本上只能买一本介绍如何从第一原理开始使用 Docker 的书,读完前几章,然后试着跳来跳去,找出如何做他想做的事。
如果是在前十年,情况有所改善。他会在网上搜索一些介绍如何使用Docker的教程,并试着跟着做,然后在网上搜索他发现的任何错误信息,看看是否有人遇到过同样的问题。
但今天,「只需要请一个语言模型来教我Docker就好」。
由于篇幅所限,有关Nicholas使用LLM的更多示例,请移步到他的个人网站(文末有参考链接)。
结论
Nicholas称自己写作这篇文章有两个动机,第一个是证明LLM已经为他提供了很多价值。
第二个是为那些「很喜欢使用LLM,但不知道它们如何帮我」的朋友提供一些示例。
在展示这些示例之后,他最常听到的反驳之一就是「但这些任务很简单!任何计算机科学专业的本科生都能学会!」
只要花几个小时四处搜索,本科生就能告诉你如何正确诊断CUDA错误,以及可以重新安装哪些软件包。
一个本科生只要花几个小时,就能用C语言重写那个程序。
一个本科生只要花几个小时,就能研究相关的教科书,教给你任何你想知道的知识。
但不幸的是,我们没有那个「神奇的本科生」,他会放下一切,回答你的任何问题。
但我们有语言模型。当然,语言模型还没有好到可以解决程序员工作中最难也最有趣的部分,目前的模型只能解决简单的任务。
五年前,LLM所能做到的最好的事情就是写出一段听起来像是英语的段落,但它们的实际效用完全为零。
但如今,它们已经让Nicholas在编程方面的工作效率平均提高了至少 50%,并且消除了足够多的繁琐工作,让他做出了许多他从未尝试过的东西。
所以,Nicholas才会旗帜鲜明地反对「LLM只是炒作」的观点。
作为一个拥有20年编程经验的科学家,Nicholas利用LLM显著提高了自己的工作效率,他相信,其他人也可以从中受益。
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享**
一、2025最新大模型学习路线
一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。
L1级别:AI大模型时代的华丽登场
L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。
L2级别:AI大模型RAG应用开发工程
L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。
L3级别:大模型Agent应用架构进阶实践
L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。
L4级别:大模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。
整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
二、大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
三、大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
四、大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
五、大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取