卷积神经网络中的特殊卷积与尺寸调整技术
1. 一维卷积(1D Convolution)
一维卷积可用于处理文本,文本可表示为一个网格,每个元素包含一个字母,行包含完整的单词(或固定数量的字母)。其基本思想是创建一个与输入宽度相同、高度为两行的滤波器。滤波器仅向下移动,不进行水平移动,这种单方向的移动赋予了它“一维卷积”的名称。
例如:
A f t e r
t h e
d o g s
w e n t
s w i m m i n g
w e
j u m p e d
我们可以创建一个覆盖整个宽度且高为两行的滤波器,先处理前两行,然后向下移动处理接下来的两行。
一维卷积可以在任意维度的输入张量上进行,只要滤波器仅在一个维度上移动。多个滤波器也可以同时在网格上向下滑动。
2. 1×1 卷积(1×1 Convolutions)
有时我们希望减少张量在网络中流动时的通道数,因为部分通道可能包含冗余信息。例如,在图像分类器中,可能有十几个滤波器用于检测不同类型的眼睛,但如果最终要将所有生物归为“生物”一类,就无需关心具体是哪种眼睛,只需知道输入图像的特定区域有眼睛即可。
假设某层有检测 12 种不同眼睛的滤波器,该层的输出张量至少有 12 个通道。若只关心是否检测到眼睛,可使用 1×1 滤波器将这 12 个通道合并为 1 个通道。操作步骤如下:
1. 创建一个 1×1 滤波器,确保滤波器数量比输入通道数至少少 11 个。
2. 网络会自动学习滤波器的权重,以产生正确的输出。
超级会员免费看
订阅专栏 解锁全文
1915

被折叠的 条评论
为什么被折叠?



