《CNN笔记总结系列之一》简要介绍及输入层

《CNN笔记总结系列之一》简要介绍及输入层

-------本文仅为学习笔记,不做任何商业用途-------

一、卷积神经网络应用

    卷积神经网络在计算机视觉领域有十分广泛的应用,尤其实在图像识别(image classification),物体识别(object recognition),行为认知(action recognition),姿态估计(pose estimation),神经风格迁移(neural style transfer)等。而在人体行为识别领域,针对图像的行为认知研究中,卷积神经网络提取的图像特征被应用于行为分类;在视频的行为认知问题中,卷积神经网络可以保持其二维结构并通过堆叠连续时间片段的特征进行学习、建立沿时间轴变化的3D卷积神经网络、或者逐帧提取特征并输入循环神经网络,三者在特定问题下都可以表现出良好的效果。

二、卷积神经网络简要介绍

    卷积神经网络(CNN)是一种专门用来处理具有类似网格结构的数据的神经网络,例如图像数据可以看作二维的像素网络,是深度学习的代表算法之一。卷积网络是指那些至少在网络的一层中使用卷积运算来代替一般的矩阵乘法运算的神经网络。

    与神经网络关系?

    在我们所学习的神经网络中,它的结构如下所示:
Alt
图片来源:https://img-blog.youkuaiyun.com/20180529161432854?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3d1dG9uZ3l1dHQ=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70
    其实卷积神经

卷积神经网络(Convolutional Neural Network,CNN)是一种常用于图像、音频等数据的深度学习模型。它通过卷积、池化等操作,对输入数据进行特征提取,最终输出分类结果。下面是一个简单的CNN的学习笔记: ## 1. 卷积 卷积CNN的核心组件之一,它通过滑动一个固定大小的卷积核(filter)在输入数据上进行卷积操作,从而提取出输入数据的局部特征。在卷积操作中,卷积核的参数是要被学习的,因此卷积可以自动学习到对输入数据最有效的特征。 卷积操作的数学定义如下: $$ y_{i,j} = \sum_{m=0}^{k-1} \sum_{n=0}^{k-1} x_{i+m,j+n} \cdot w_{m,n} $$ 其中,$x$ 是输入数据,$y$ 是卷积后的输出数据,$w$ 是卷积核。$k$ 是卷积核的大小。在卷积操作中,卷积核从左上角开始,每次向右移动一个像素,直到遍历完整张图片,得到卷积后的输出数据。 ## 2. 池化 池化是一种用于减少特征图大小的操作。它将输入数据的局部区域进行池化操作,输出一个单一的值。常用的池化操作包括最大池化、平均池化等。 最大池化操作的数学定义如下: $$ y_{i,j} = \max_{m=0}^{k-1} \max_{n=0}^{k-1} x_{i+m,j+n} $$ 其中,$x$ 是输入数据,$y$ 是池化后的输出数据。$k$ 是池化的大小。 ## 3. 全连接 全连接CNN的输出,它将卷积和池化提取到的特征进行连接,并输出最终的分类结果。在全连接中,每个神经元都与上一的所有神经元相连接,因此全连接的参数量很大。 ## 4. Dropout Dropout是一种防止过拟合的技术。在训练过程中,Dropout会随机将一部分神经元的输出设置为0,从而强制神经网络学习到更加鲁棒的特征。 ## 5. 损失函数 损失函数是CNN训练过程中的关键指标,它用于评估模型的预测结果与真实结果之间的差异。常用的损失函数包括交叉熵损失函数、均方误差损失函数等。 ## 6. 优化器 优化器是用于更新神经网络参数的算法。常用的优化器包括随机梯度下降(SGD)、Adam等。 以上是一个简单的CNN的学习笔记,希望对你有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值