卷积神经网络:1D卷积、1×1卷积及输出尺寸调整技术解析
在卷积神经网络的世界里,有几种关键的技术能帮助我们更高效地处理数据和构建模型,包括1D卷积、1×1卷积,以及改变输出尺寸的方法(如池化和步幅调整)。下面我们将深入探讨这些技术。
1D卷积
1D卷积在处理文本等数据时非常有用,文本可以表示为一个网格,每个元素包含一个字母,行包含完整的单词(或固定数量的字母)。
其基本思想是创建一个与输入宽度相同、高度为两行的滤波器。滤波器只向下移动,不进行水平移动。第一次应用滤波器处理前两行的所有内容,然后向下移动滤波器处理接下来的两行。这种单一方向的移动就是“1D”卷积名称的由来。
我们可以有多个滤波器在网格上向下滑动,只要滤波器本身只在一个维度上移动,就可以对任意维度的输入张量执行1D卷积。1D卷积并没有什么特别之处,只是滤波器只在一个方向上移动,这个名称强调了滤波器移动的局限性。
1×1卷积
有时候,我们希望在张量流经网络时减少其通道数,因为有些通道可能包含冗余信息。例如,在一个识别照片中主要对象的分类器中,可能有十几个滤波器用于检测不同类型的眼睛(如人类眼睛、猫眼睛、鱼眼睛等)。但如果最终要将所有生物归为“生物”这一类,就不需要关心具体是哪种眼睛,只需要知道输入图像的特定区域有眼睛即可。
假设一个层中的滤波器可以检测12种不同类型的眼睛,那么该层的输出张量至少会有12个通道,每个通道对应一个滤波器。如果我们只关心是否检测到眼睛,可以通过合并或压缩这12个通道为1个通道来修改张量,该通道表示每个位置是否有眼睛。
实现这一点并不需要新的方法。我们每次处理一个输入元素,创建一个尺寸为1×
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



