感受野与权值共享

什么是全连接?

若有一幅100x100的图像,隐层有100个神经元,每个神经元与每个像素全部连接,则有100*100*100个连接,这就叫做全连接。


什么是局部连接?

若有一幅100x100的图像,隐层有100个神经元,每个神经元只和10*10个像素相连接,那么就有10*10*100个连接


什么是感受野?

https://blog.youkuaiyun.com/gzq0723/article/details/53138430

在神经网络中,感受野的定义是: 
卷积神经网络的每一层输出的特征图(Feature map)上的像素点在原图像上映射的区域大小。 

若输入层通过第一层(kernel_size = 3x3,stride = 1),再通过第二层(kernel_size = 2,stride = 1)计算第二层对于输入层的感受野?

这里的第二层的stride大小与计算无关,很显然第一层对于输入层的感受野是3x3,第二层对于第一层的感受野为2x2

计算第二层关于输入层的感受野文字描述如下:

因为第二层kernel_size = 2,所以第二层输出的feature map上的像素点在第二层上的区域大小是2x2,因为第一层的感受野是3x3,stride是1,所以第二层的输出在输入层的映射为4x4,则第二层关于输入层的感受野是4x4

从上图应该能比较直观地看出。

感受野计算公式:V = ((V‘-1) * stride)+ ksize

计算是由最深层往浅层计算

V‘是当前层相对于前一层的感受野,大小是:VxV,stride是前一层卷积核的步长,ksize前一层滤波器的size。

所以VGG16里面用3个3x3的卷积核代替了一个7x7的卷积核,两者的感受野是一样的V1 = (3 - 1) * 1 + 3 = 5

V2 = (5 - 1)*1 + 3 = 7


什么是权值共享?

神经网络处理图像的参数很多,例如上面说的一幅100*100的图片有100个神经元,则共有参数(100*100*100)个参数,太多了,假如一个神经元的感受野是10x10,每个神经元只需要和10*10的局部图像连接,则每个神经元对于局部图像的参数是10*10+1(包括偏置项b),但是全局图像是100*100,10*10的只是局部图像,如果全局图像中各个局部图像之间权值共享的话,即10*10+1个参数在不同局部图像上参数应用相同的话,则在全局图像上通过全局共享则全局只需要10*10+1个参数;然而如果有1000个神经元,那么参数数量是1000*(10*10+1),还是很多,所以要是所有的神经元都共享这(10*10+1)个参数的话,神经元再多参数还是(10*10+1),所以通过权值共享之后,无论图像再大,神经元个数再多参数都是(感受野大小+1)个参数。

一种滤波器也就是一种卷积核就是提取图像一种特征,例如某个方向的边缘。那么我们需要提取不同特征就要多加几个滤波器了。若有N个滤波器,每个滤波器的参数不一样,表示提取输入图像不同特征,例如不同边缘。这样不同滤波器去卷积图像就得到不同特征的放映,我们称之为Feature Map,所以N个卷积核就有N个Feature Map,这100个Feature Map就组成了一层神经元。参数数为:N*(感受野大小+1)

第二章 课题研究相关模型理论基础 2.1 深度学习基础理论 2.1.1 卷积神经网络(CNN)基本结构 • 卷积层:局部感受野权值共享原理 • 池化层:最大池化平均池化操作 • 全连接层:特征映射到分类结果 2.1.2 激活函数原理 • ReLU函数及其变体(Leaky ReLU, PReLU) • SigmoidTanh函数的梯度消失问题 • Swish激活函数的自适应特性 2.1.3 损失函数理论 • 交叉熵损失函数 • 均方误差损失函数 • Focal Loss在类别不平衡中的应用 2.1.4 优化算法原理 • 随机梯度下降(SGD)及其动量优化 • Adam优化器的自适应学习率 • 学习率衰减策略 2.2 目标检测相关模型 2.2.1 两阶段检测算法 • Faster R-CNN框架原理 • 区域建议网络(RPN)工作机制 • RoI Pooling/RoI Align技术对比 2.2.2 单阶段检测算法 • YOLO系列算法演进/YOLO系列算法演进/v1-v8) • SSD算法的多尺度特征检测 • RetinaNet的FPN结构设计 2.2.3 Anchor-free检测方法 • CenterNet的基于关键点检测 • FCOS的全卷积单阶段检测 • DETR的Transformer架构 2.3 盲道障碍物检测特殊性 2.3.1 盲道纹理特征分析 • 条状凸起纹理的频域特征 • 颜色对比度敏感性分析 • 表面连续性检测标准 2.3.2 障碍物检测挑战 • 小目标检测难题(硬币、瓶盖等) • 光照变化鲁棒性需求 • 动态背景干扰问题 2.3.3 实时性要求 • 移动端部署的模型轻量化 • 多尺度特征融合优化 • 推理速度精度平衡 2.4 相关算法技术 2.4.1 图像预处理算法 • 基于HSV的盲道区域分割 • 自适应直方图均衡化 • 非局部均值去噪 2.4.2 数据增强策略 • CutMix/Mosaic增强技术 • 光照条件模拟增强 • 透视变换数据生成 2.4.3 模型优化方法 • 知识蒸馏轻量化策略 • 通道剪枝量化技术 • NAS神经网络架构搜索 2.4.4 多任务学习框架 • 检测分割联合学习 • 深度估计辅助任务 • 注意力机制融合 (注:具体内容撰写时需要补充各方法的数学表达式、结构图示及相关参考文献,建议每个子章节包含算法伪代码或公式推导)可以帮我把上面每个点都细写一下吗也可以包括代码和图片
最新发布
03-25
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值