机器学习--卷积神经网络3

本文探讨了下采样在保持模式识别的同时减小图像尺寸的重要性,介绍了汇聚(如最大汇聚和平均汇聚)作为固定操作符用于减少计算量,以及卷积、汇聚、扁平化和全连接层在经典图像识别网络中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、观察3:下采样不影响模式检测

把一张比较大的图像做下采样(downsampling),把图像偶数的列都拿掉,奇数的行都拿掉,图像变成为原来的 1/4,但是不会影响里面是什么东西。如图,把一张大的鸟的图像缩小,这张小的图像还是一只鸟。
在这里插入图片描述

二、简化3:汇聚

汇聚比较像 Sigmoid、 ReLU 等激活函数,因为它里面是没有要学习的参数的,它就是一个操作符(operator),其行为都是固定好的。

每个滤波器都产生一组数字,要做汇聚的时候,把这些数字分组,可以 2 × 2个一组,3 × 3、4 × 4 也可以。

汇聚有很多不同的版本,以最大汇聚(max pooling) 为例。最大汇聚在每一组里面选一个代表,选的代表就是最大的一个。
在这里插入图片描述
最大汇聚结果:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值