大语言模型已“死”?AI下阶段该做什么?一文带你了解AI未来趋势!

上个月Sutton老爷子发了一篇推文,意思说大语言模型(LLM)被证明是没有办法实现AGI(通用人工智能)。Sutton这一句话等于是彻底对大语言模型宣判了“死刑”,为什么这么说呢?因为Sutton本人可以说是大语言模型的奠基人,其发表的《**苦涩的教训》**是后续大语言模型扩大计算的理论基础。

可以这么说,Sutton对于大语言模型,就像是比尔盖茨对于windows,如果哪天比尔盖茨发文说windows系统永远没有mac os好用,那对于很多人来说,无异于信仰崩塌了,而Sutton就是做了这样的一件事。

为什么会这样呢?我们稍微展开分析。

老爷子原推文

翻译了一下

人工智能到底是什么?

不知道多少人清楚AGI到底指的是什么?如果熟悉电影的朋友,当下对AGI的理解有点像《终结者》里面的“天网”,或者像是《变形金刚》里面的“赛博坦星人”,它是一个纯粹的硅基智能体(人类可以算是碳基智能体)。简单来说人工智能的终极目标是创造一个具有智慧思考能力的数字智慧体。 科学家们对这个目标的追求是统一且持续的。

但是这个太难了。 初期科学家们只能将所有物理世界的一切,尽量的数字化或者数据化,这样能够让程序理解,变成可以智能处理流程的程序。不过很快语言模型技术得到的突破。 语言模型技术本质上就是对人类自然语言的一种分析和理解,这样就能够使得机器或者说程序能够和人类对话,也就是这个阶段开始分裂出多种技术发展派别。其中一派认为只要我们可以不断地投入足够多的训练数据,将所有的信息都喂给语言模型进行训练,只要有足够的算力做支持,那么语言模型就能够理解所有的事情,并且反馈所有需要的信息。

这就是Sutton老爷子为代表的大语言模型派的核心思路,也是过去五年人工智能的发展主流思想。

几乎是大语言模型突然爆火的同时(2022年),以Yann LeCun为首的教授就反对大语言模型可以实现AGI的这一说法,主要原因有三个:

  1. 当下所有数据(或者说信息)即便全部统计到了,但是仍无法揭示这些数据之前的因果关系是成立的。 举个不恰当的例子,人工智能看到刘翔每天训练跑步四个小时,然后就获得世界冠军,因此判断我训练四个小时就也可以获得世界冠军。即便后续可以通过加上,什么身高,体重,腿长之类的数据打补丁,但是仍不可能仅通过看到的信息,就能够建立完整的因果关系,真实的世界远比这个复杂得多。
  2. 世界的本质是混沌模型,而非逻辑模型。 这一点对我们普通人也很重要,很多人尤其是学历越高的人,越容易把世界看成一种可以理解的逻辑模型,试图将看到的一切转化为具有清晰逻辑关系的推理模型,并且思考的越复杂越觉得自己理解得多。但是世界的本质更接近于混沌模型,即每个变量的因果关系不是线性链接的,甚至不是逻辑链接的,有可能纯粹就是上帝在掷色子玩。 混沌模型最有名的就是“蝴蝶的翅膀”,一个小小的变量也会引发巨大的变化,而这个变量本质是不可测的。
  3. 训练数据的堆砌是有极限的。 这个相对好理解,普通的人或许会觉得他的知识储备有10G算是比较多的,那人工智能能达到1000G说明人工智能很厉害。但是终究这个知识储备是有极限的,也就是说能够给语言模型训练的数据是有极限的,事实上经过测算2026年中,大模型就会消耗光所有可训练的自然语言数据资源,之后的大模型就没有新的数据可以训练了,只能用合成数据来替代。

正是因为这三个原因,所以反对大语言模型的人,一直坚定地认为大语言模型最多只能实现基础的自然语言理解,是没有可能性实现AGI的。

我做个类比,如果AGI是中国文化里面追求的“长生不老”,那大语言模型相当于告诉你要多吃丹药,强身健体。最终你可能活得比普通人长寿一些(也未必),但是这种手段是不可能实现”长生不老“的终极目标。

那什么是正确的?

客观说我自己也不知道,科研方向上,从几位大佬的论文目前的方向应该还是“混合架构的神经网络系统”,更有可能实现AGI。 为方便大家理解这个是什么意思,我用我自己的孩子做个类比。

我在教育孩子的时候就发现你很难让孩子理解你理解的知识。 这个现象我相信只要当父母的都能理解,由于各种原因,比如“孩子还小,不到五岁”,“孩子智力还没发育完全”,“孩子还没学过那么多课”,“孩子还没经历过那么多事”等等原因,几乎不可能父母教育孩子的时候,是可以把自己完整的逻辑、知识和思考过程传达给孩子的,科学家训练人工智能的时候也是遇到这个问题。

大语言模型派,就像是那种控制欲很强的父母。他会逼迫孩子不断地看书,不断地学习“道理”,认为孩子只要读的书足够多,明白总结出来的道理足够多,那么这个孩子就能够“正确的思考事情,得出正确的结论”。 只要当过父母的,就知道这个想法多离谱了。

混合神经网络派,有点像是那种给孩子“铺路”的父母。他们会搭建多种架构的神经网络(多个发展渠道),通过喂养数据来不断测试人工智能的信息反馈,然后不断地总结因果关系,从而调整投放数据,以期待最后出现一个很棒的人工智能。有点类似父母先带孩子学画画,发现没有天赋,就带去唱歌,发现没有天赋,就带去跑步,诶最后发现孩子跑步很有天赋,然后培养了个世界跑步冠军。 这个路径总体而言比大语言模型更可能培养出AGI,但是实现的方式主要靠“玄学”,而不是科学。

所以什么是对的?目前我自己是没有看到,甚至连思路都没看到。很多人认为世界模型可以拯救一切,但是寄希望在某项技术就能够实现AGI在我看来是荒谬的,未来世界一定是多种技术都融合之后走出来的路才是最容易成功的。

这个事对产业或者投资有什么影响的?

这个事的底层影响其实蛮大的,其实从年初起,硅谷的创投圈就不怎么投做基础大模型的企业了,一方面基础大模型很烧钱,只有少数大企业玩得起,另一方面基础大模型离商业还有不少距离,还没有明确的盈利模式。所以今年创投圈更喜欢投行业小模型和一些能具体应用的人工智能产品。

在前段时间的云栖大会上阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表主旨演讲,称大模型是下一代操作系统,客观说他观点是对的但是这页PPT做的有点简单了,没有反映出来大模型会变成操作系统的逻辑在哪。差不多没过几天奥特曼在OpenAI开发者大会发布的Apps SDK就完整的呈现了大模型已经彻底变成了人工智能底层算法推理的基础能力,下阶段就是将这种能力,转化为应用,因此大模型彻底成为了操作系统,而不是程序了。

吴泳铭的演讲

山姆·奥特曼发布的工具集

由此我们看到,在人工智能发展过程中,大模型阶段已逐步走弱,人工智能应用逐步上升,而那些掌握混合神经网络算法的公司,正在孕育着未来的爆款应用。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

请添加图片描述
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员辣条

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值