四、卷积神经网路 (Convolutional networks (CNN))

本文详细介绍了卷积神经网络(CNN)的核心概念,包括卷积操作、动机(稀疏交互、参数共享、等变表示)、池化以及卷积函数的变体。CNN在图像处理中广泛应用,通过卷积层、池化层提取特征,实现对输入数据的高效表示和处理。


简单来说,卷积神经网路是神经网路至少有一层的矩阵乘操作替换 卷积操作(convolution)

1、卷积操作

卷积操作常见表示形式是两个实值函数之间的操作。下面以一个简单的问题解释卷积操作。

假设我们使用激光传感器来追踪一个飞船的位置,由此得到飞船位置关于时间的函数 x ( t ) x(t) x(t)。并且传感器工作在有噪声的环境里,为了降低噪声的影响,我们将采取加权平均来给予最近测量更大的权重。假设权重函数为 w ( a ) w(a) w(a),其中 a a a 是测量发生的时间。我们得到以下公式来预测飞船位置, s ( t ) = ∫ x ( a ) w ( t − a )   d a s(t)=\int x(a)w(t-a)\,da s(t)=x(a)w(ta)da上述即为卷积操作,卷积操作可以有 ∗ * 表示,则有 s ( t ) = ( x ∗ w ) ( t ) s(t)=(x*w)(t) s(t)=(xw)(t)。且在本例中 w w w 应为概率密度函数。在卷积神经网路中, x x x 函数为输入, w w wkernal

在实际问题中,激光传感器的时间是离散的,例如 1 秒一次采样。那么有离散形式的卷积操作, s ( t ) = ( x ∗ w ) ( t ) = ∑ a = − ∞ + ∞ x ( a ) w ( t − a ) s(t)=(x*w)(t)=\sum _{a=-\infin}^{+\infin}x(a)w(t-a) s(t)=(xw)(t)=a=+x(a)w(ta)在机器学习问题中,输入常是多维的。下面给出卷积操作的二维形式, S ( i , j ) = ( I ∗ K ) ( i , j ) ∑ m ∑ n I ( m , n ) K ( i − m , j − n ) S(i,j)=({I*K})(i,j)\sum_m \sum_n I(m,n)K(i-m,j-n) S(i,j)=(IK)(i,j)mnI(m,n)K(im,jn)卷积操作是交换,这意味着上式等价于, S ( i , j ) = ( K ∗ I ) ( i , j ) ∑ m ∑ n I ( i − m , j − n ) K ( m , n ) S(i,j)=({K*I})(i,j)\sum_m \sum_n I(i-m,j-n)K(m,n) S

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值