43、卷积神经网络:1D卷积、1×1卷积及输出尺寸调整技术解析

卷积神经网络:1D卷积、1×1卷积及输出尺寸调整技术解析

在卷积神经网络的世界里,有几种关键的技术能帮助我们更高效地处理数据和构建模型,包括1D卷积、1×1卷积,以及改变输出尺寸的方法(如池化和步幅调整)。下面我们将深入探讨这些技术。

1D卷积

1D卷积在处理文本等数据时非常有用,文本可以表示为一个网格,每个元素包含一个字母,行包含完整的单词(或固定数量的字母)。

其基本思想是创建一个与输入宽度相同、高度为两行的滤波器。滤波器只向下移动,不进行水平移动。第一次应用滤波器处理前两行的所有内容,然后向下移动滤波器处理接下来的两行。这种单一方向的移动就是“1D”卷积名称的由来。

我们可以有多个滤波器在网格上向下滑动,只要滤波器本身只在一个维度上移动,就可以对任意维度的输入张量执行1D卷积。1D卷积并没有什么特别之处,只是滤波器只在一个方向上移动,这个名称强调了滤波器移动的局限性。

1×1卷积

有时候,我们希望在张量流经网络时减少其通道数,因为有些通道可能包含冗余信息。例如,在一个识别照片中主要对象的分类器中,可能有十几个滤波器用于检测不同类型的眼睛(如人类眼睛、猫眼睛、鱼眼睛等)。但如果最终要将所有生物归为“生物”这一类,就不需要关心具体是哪种眼睛,只需要知道输入图像的特定区域有眼睛即可。

假设一个层中的滤波器可以检测12种不同类型的眼睛,那么该层的输出张量至少会有12个通道,每个通道对应一个滤波器。如果我们只关心是否检测到眼睛,可以通过合并或压缩这12个通道为1个通道来修改张量,该通道表示每个位置是否有眼睛。

实现这一点并不需要新的方法。我们每次处理一个输入元素,创建一个尺寸为1×

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值