深度学习之殇

如今,谈到人工智能,人们第一个想到的是深度学习。大量的人力物力财力被投入到深度学习中去。但事实上,深度学习本质上是对大量样本统计规律的归纳,被称为统计学习。统计学习是AI的初级阶段,统计学习之上还有其他学习,从高到低分别是:

 

数学归纳法

进化

学习

逻辑推理

经验学习

统计学习

经验学习是什么?经验学习是指基于贝叶斯公式和贝叶斯网络的学习。其本质是用新发生的现象、事实和证据改变人们对事物本质的老的认识。

比如,通过统计,男女司机的比例是8:2。某地发生了一起严重车祸,请问司机是男人的概率是多少?当然是80%,不过这是基于统计规律的认识,没有考虑到发生严重车祸这个事实。假设男女司机发生严重车祸的概率分别是10%和1%,则那位司机是男人的概率迅速上升为97.56%,几乎可以肯定是个男人。这就是经验学习。

逻辑推理则是比经验学习更高级的AI技术。最简单的逻辑推理就是三段式:所有的猫都爱干净,Tom是一只猫,所以Tom爱干净。

至于数学归纳法,则是比逻辑推理还要高级的AI技术。逻辑推理是根据现有的证据和事实推导出一个百分之一百成立的结论。比如欧几里得几何就是基于6条公理推导出来的一个完备的系统。爱因斯坦相对论则是根据光速不变性推导出来的。而数学归纳法则是“创造”出一个结论。

比如,1的平方等于1,假设前k个奇数的和是k的平方,那么前k+1个奇数的和就是k的平方加2k+1,这个数恰恰就是k+1的平方。所以,前n个奇数的和一定等于n的平方。

数学归纳法就是通过这个手段“创造”出一个结论的,压根走的不是逻辑推理的路子。

有意思的是,深度学习、贝叶斯公式和贝叶斯网络、逻辑推理以及进化学习都有较实用的技术和产品为我们服务,但数学归纳法没有。更重要的是,所有这些学习都是各自独立,没有像人脑一样把他们融合在一起。可能读者中就有一个计算机科学和数学大神,能为中国率先破解大脑思考的奥秘做出贡献。

进化学习的本质是蒙特卡洛方法,这个方法可以伴随并且提高任意一种学习,所以这里不讨论它。

可以看出,深度学习处于AI大厦的最底端,它是为所有处于其上的学习提供原材料的。所以,深度学习远远没有你想象的那么功能强大,即使Alpha Go能够战胜人类最出色的围棋手。比如,我们用GAN可以画出逼真的人脸,那是因为所有人类的人脸其实是很相似的,都是在脸上差不多相同的位置有两只眼睛、一张嘴。要想让他画出一个白化病人的人脸,它就无能为力了,除非样本中有大量白化病人人脸样本。

Alpha Go的确战胜了人类,不过其中发挥决定性作用的是基于逻辑推理的博弈算法,深度学习只不过帮助判断了一个棋局的好坏。换句话说,Alpha Go跟3、40年前就战胜人类棋手的国际象棋、象棋等程序没有什么本质的不同。区别仅在于,如果没有深度学习,围棋程序需要深入到三百多步后才能判断当前应该走哪一步,其计算量是个天文数字。想想看,一张纸只需折叠7、80次,其高度就会超出如今已知的宇宙的边缘,组合爆炸是多么恐怖的事。如今有了深度学习,围棋程序只需搜索到4、5步后就可以进行判断了。

统计学习的弊端远远不止如此。要想识别表情,起码要准备几万个带标签的表情样本才能训练出一个比较靠谱的模型。但是婴幼儿识别不同表情只需几百个或者更少的样本就行。为啥?举个例子,要想理解“笑”这个表情,眼睛、嘴巴之间其实是有一定逻辑关系的,其背后更深刻的原因可能涉及到人脸上肌肉的分布甚至人类进化史。这么复杂的东西怎么可能仅靠统计学习和少量样本归纳出来?

所以,千万不要沾沾自喜于你对深度学习的一点粗浅理解,即使你深刻理解了深度学习,那只不过是万里长征的第一步。要想实现类脑学习,实现强人工智能,逻辑推理一定是不可或缺的一环。

### 关于深度学习中的边缘锐化技术 在深度学习领域,边缘锐化是一种重要的图像处理技术,旨在提高图像的质量并突出细节特征。这种方法通常依赖神经网络模型来自动识别和强化图像边界。 #### 卷积神经网络(CNNs) 卷积层作为CNN的核心组件,在提取局部模式方面表现出色。对于边缘检测而言,特定类型的滤波器可以被训练或设计成捕捉不同方向上的梯度变化[^1]。当应用于输入图片时,这些过滤器能够放大像素间的差异,进而达到增强轮廓的效果。 #### 自动编码器(Autoencoders) 另一种常见的做法是利用自编码架构来进行无监督学习。该框架下的生成对抗网络(GAN)或者变分自编码器(VAE),可以通过最小化重建误差的方式优化参数设置,使得输出端得到更清晰锐利的结果图象[^3]。 #### 数据集准备与预处理 为了使模型更好地适应实际应用场景,应当收集大量具有代表性的样本用于训练过程。同时还需要考虑如何有效地标注目标区域以及采取何种方式扩充数据量等问题。此外,标准化操作如裁剪、缩放等也是必不可少的环节之一。 #### 训练流程概述 定义损失函数以衡量预测值同真实标签之间的差距;选用合适的优化算法调整权重直至收敛;最后经过充分迭代后的系统便具备了一定程度上改善画质的能力。值得注意的是,超参调优在整个过程中占据着至关重要的地位,合理的配置有助于提升最终性能表现。 ```python import tensorflow as tf from tensorflow.keras import layers, models def create_model(): model = models.Sequential() # 添加多个卷积层 model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(None, None, 3))) model.add(layers.MaxPooling2D((2, 2))) model.add(layers.Conv2D(64, (3, 3), activation='relu')) model.add(layers.MaxPooling2D((2, 2))) model.add(layers.Conv2DTranspose(64, (3, 3), strides=2, padding='same', activation='relu')) model.add(layers.Conv2DTranspose(32, (3, 3), strides=2, padding='same', activation='relu')) # 输出层采用sigmoid激活函数确保输出范围位于0到1之间 model.add(layers.Conv2D(3, (3, 3), padding='same', activation='sigmoid')) return model ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

方林博士

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值