深度学习之殇

最新推荐文章于 2025-02-28 11:21:55 发布

原创最新推荐文章于 2025-02-28 11:21:55 发布 · 308 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #类脑学习

计算机科学同时被 2 个专栏收录

42 篇文章

订阅专栏

科技与生活

6 篇文章

订阅专栏

本文探讨了人工智能学习的不同层次，从数学归纳法、逻辑推理到统计学习和经验学习。深度学习作为统计学习的基础，虽然在某些领域表现出色，如图像识别和围棋，但它依赖大量样本且无法像人类那样进行逻辑推理和适应性学习。作者强调，实现类脑学习和强人工智能，逻辑推理是不可或缺的一环。深度学习并非万能，其局限性在于无法处理复杂的逻辑关系和小样本学习问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

如今，谈到人工智能，人们第一个想到的是深度学习。大量的人力物力财力被投入到深度学习中去。但事实上，深度学习本质上是对大量样本统计规律的归纳，被称为统计学习。统计学习是AI的初级阶段，统计学习之上还有其他学习，从高到低分别是：

数学归纳法	进化学习
逻辑推理
经验学习
统计学习

经验学习是什么？经验学习是指基于贝叶斯公式和贝叶斯网络的学习。其本质是用新发生的现象、事实和证据改变人们对事物本质的老的认识。

比如，通过统计，男女司机的比例是8:2。某地发生了一起严重车祸，请问司机是男人的概率是多少？当然是80%，不过这是基于统计规律的认识，没有考虑到发生严重车祸这个事实。假设男女司机发生严重车祸的概率分别是10%和1%，则那位司机是男人的概率迅速上升为97.56%，几乎可以肯定是个男人。这就是经验学习。

逻辑推理则是比经验学习更高级的AI技术。最简单的逻辑推理就是三段式：所有的猫都爱干净，Tom是一只猫，所以Tom爱干净。

至于数学归纳法，则是比逻辑推理还要高级的AI技术。逻辑推理是根据现有的证据和事实推导出一个百分之一百成立的结论。比如欧几里得几何就是基于6条公理推导出来的一个完备的系统。爱因斯坦相对论则是根据光速不变性推导出来的。而数学归纳法则是“创造”出一个结论。

比如，1的平方等于1，假设前k个奇数的和是k的平方，那么前k+1个奇数的和就是k的平方加2k+1，这个数恰恰就是k+1的平方。所以，前n个奇数的和一定等于n的平方。

数学归纳法就是通过这个手段“创造”出一个结论的，压根走的不是逻辑推理的路子。

有意思的是，深度学习、贝叶斯公式和贝叶斯网络、逻辑推理以及进化学习都有较实用的技术和产品为我们服务，但数学归纳法没有。更重要的是，所有这些学习都是各自独立，没有像人脑一样把他们融合在一起。可能读者中就有一个计算机科学和数学大神，能为中国率先破解大脑思考的奥秘做出贡献。

进化学习的本质是蒙特卡洛方法，这个方法可以伴随并且提高任意一种学习，所以这里不讨论它。

可以看出，深度学习处于AI大厦的最底端，它是为所有处于其上的学习提供原材料的。所以，深度学习远远没有你想象的那么功能强大，即使Alpha Go能够战胜人类最出色的围棋手。比如，我们用GAN可以画出逼真的人脸，那是因为所有人类的人脸其实是很相似的，都是在脸上差不多相同的位置有两只眼睛、一张嘴。要想让他画出一个白化病人的人脸，它就无能为力了，除非样本中有大量白化病人人脸样本。

Alpha Go的确战胜了人类，不过其中发挥决定性作用的是基于逻辑推理的博弈算法，深度学习只不过帮助判断了一个棋局的好坏。换句话说，Alpha Go跟3、40年前就战胜人类棋手的国际象棋、象棋等程序没有什么本质的不同。区别仅在于，如果没有深度学习，围棋程序需要深入到三百多步后才能判断当前应该走哪一步，其计算量是个天文数字。想想看，一张纸只需折叠7、80次，其高度就会超出如今已知的宇宙的边缘，组合爆炸是多么恐怖的事。如今有了深度学习，围棋程序只需搜索到4、5步后就可以进行判断了。

统计学习的弊端远远不止如此。要想识别表情，起码要准备几万个带标签的表情样本才能训练出一个比较靠谱的模型。但是婴幼儿识别不同表情只需几百个或者更少的样本就行。为啥？举个例子，要想理解“笑”这个表情，眼睛、嘴巴之间其实是有一定逻辑关系的，其背后更深刻的原因可能涉及到人脸上肌肉的分布甚至人类进化史。这么复杂的东西怎么可能仅靠统计学习和少量样本归纳出来？

所以，千万不要沾沾自喜于你对深度学习的一点粗浅理解，即使你深刻理解了深度学习，那只不过是万里长征的第一步。要想实现类脑学习，实现强人工智能，逻辑推理一定是不可或缺的一环。