卷积神经网络闲扯-------也许并没有LUAN用的LRN

卷积神经网络中的局部响应归一化（LRN）解析

最新推荐文章于 2024-03-21 04:46:35 发布

原创最新推荐文章于 2024-03-21 04:46:35 发布 · 693 阅读

0 ·

CC 4.0 BY-SA版权

nn 同时被 2 个专栏收录

5 篇文章

订阅专栏

cnn

2 篇文章

订阅专栏

本文介绍了卷积神经网络中的局部响应归一化（LRN）技术，该技术源自AlexNet，但在VGGNet中被认为作用不大。LRN通过在通道维度上对神经元进行归一化，模拟生物神经元的侧抑制现象。文章提供了TensorFlow中LRN函数的使用示例，并给出了LRN公式的详细解释，帮助读者理解其工作原理。

alexnet当中提出，不过VGGNet当中被视为是没啥LUAN用的~

闲来无事也学习下（感性理解下）：

tensorflow函数：

tf.nn.lrn(input,depth_radius=None,bias=None,alpha=None,beta=None,name=None)

The 4-D input tensor is treated as a 3-D array of 1-D vectors (along the last dimension), and each vector is normalized independently. Within a given vector, each component is divided by the weighted, squared sum of inputs within depth_radius. In detail,
sqr_sum[a, b, c, d] =
sum(input[a, b, c, d - depth_radius : d + depth_radius + 1] ** 2)

output = input / (bias + alpha * sqr_sum) ** beta

为什么要有局部响应归一化（Local Response Normalization）？

详见http://blog.youkuaiyun.com/hduxiejun/article/details/70570086

局部响应归一化原理是仿造生物学上活跃的神经元对相邻神经元的抑制现象（侧抑制），然后根据论文有公式如下

这个公式中的a表示卷积层（包括卷积操作和池化操作）后的输出结果，这个输出结果的结构是一个四维数组[batch,height,width,channel]，这里可以简单解释一下，batch就是批次数(每一批为一张图片)，height就是图片高度，width就是图片宽度，channel就是通道数可以理解成一批图片中的某一个图片经过卷积操作后输出的神经元个数(或是理解成处理后的图片深度)。ai(x,y)表示在这个输出结构中的一个位置[a,b,c,d]，可以理解成在某一张图中的某一个通道下的某个高度和某个宽度位置的点，即第a张图的第d个通道下的高度为b宽度为c的点。论文公式中的N表示通道数(channel)。a,n/2,k,α,β分别表示函数中的input,depth_radius,bias,alpha,beta，其中n/2,k,α,β都是自定义的，特别注意一下∑叠加的方向是沿着通道方向的，即每个点值的平方和是沿着a中的第3维channel方向的，也就是一个点同方向的前面n/2个通道（最小为第0个通道）和后n/2个通道（最大为第d-1个通道）的点的平方和(共n+1个点)。而函数的英文注解中也说明了把input当成是d个3维的矩阵，说白了就是把input的通道数当作3维矩阵的个数，叠加的方向也是在通道方向。

理解为激活的神经元抑制附近的神经元

例子