CNN中常见卷积操作输出计算

最新推荐文章于 2025-03-31 17:14:19 发布

gladosAI

最新推荐文章于 2025-03-31 17:14:19 发布

阅读量7.1k

点赞数 5

分类专栏： CNN 文章标签： CNN 机器视觉

本文链接：https://blog.youkuaiyun.com/u011597050/article/details/79935070

版权

CNN 专栏收录该内容

2 篇文章

订阅专栏

一般卷积计算输出计算， $M=\frac{N+2*Pad-kernal}{stride}+1$ ，其中N为输入N×N图像的一边长、Pad为Padding填充数、kernal为卷积核（一般3×3）的单边数、stride为kernal的移动步长。

 
   这里需要注意，M为向下取正，所以当（P=1, K=3, S=2）时，N=5与N=6计算得到M都为3 
  。

Dilated卷积输出计算， $M=\frac{N+2*Pad-（kernal*dilationrate-1)}{stride}+1$ ，其中dilaterate就为空洞数、核间隔（ $dilationrate\geq2$ ）。就是k放大后计算一般卷积输出。

Transpose卷积输出计算，。

 
  这里需要注意的是TransCONV操作一般会指定 output_shape，因为例如对（3,3,1）做反卷还原，它的原始输入既可能是（5，5, 1）也可能为（6, 6, 1）。

 
  在一般编程框架中，Padding参数为(Full=2, SAME=1, valid=0）， 
  注意发现当卷积核为偶数时，计算公式在程序里就不对了，因为程序里（tensorflow）SAME表示输入输出大小一致，所以这时可以将SAME=2看待。一般不会用偶数卷积核（4X4）

个人理解，欢迎指教，谢谢。

参考：CNN之间的计算，TensorFlow】tf.nn.conv2d_transpose是怎样实现反卷积的？，如何理解深度学习中的deconvolution networks？,如何理解空洞卷积（dilated convolution）？, tensorflow学习笔记(三十二):conv2d_transpose ("解卷积"),网易云课堂-卷积神经网络

这个网页可以点开来看下，做的挺好 https://distill.pub/2016/deconv-checkerboard/

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

gladosAI

关注关注

5
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

计算机视觉卷积神经网络（CNN）基础：从LeNet到ResNet

优快云博客专家，系统架构师，有合作、疑惑请私信博主。

04-11

6万+

计算机视觉卷积神经网络（CNN）基础：从LeNet到ResNet，在计算机视觉领域，卷积神经网络（Convolutional Neural Network，CNN）已然成为推动众多任务发展的核心力量。从早期简单的图像识别，到如今复杂的目标检测、语义分割、图像生成等任务，CNN 都展现出了卓越的性能。CNN 的发展历程见证了一系列经典模型的诞生，其中 LeNet 作为开山之作，为 CNN 的发展奠定了基础，而 ResNet 则通过创新性的设计，突破了传统神经网络的限制，使得网络能够构建得更深、性能更优。

【卷积基础】CNN中一些常见卷积（1*1卷积、膨胀卷积、组卷积、深度可分离卷积）

CV在读

11-08

2702

参考：，也称为 1x1 卷积，是一种特殊的卷积操作，其中卷积核的大小为 1x1。这种卷积操作不会覆盖空间维度（height 和 width），而是只作用于每个位置上的所有通道，这使得逐通道卷积主要用于。

参与评论您还未登录，请先登录后发表或查看评论

卷积输出计算

hzh839900的专栏

09-08

541

当步长=1 时候公式变为Math.floor((输入W-卷积核W+填充W+1)/1)= (输入W-卷积核W+填充W+1)卷积后大小 = Math.floor((输入W-卷积核W+填充W+步长W)/步长W)

卷积输入输出计算

cuisidong1997的博客

11-13

1468

1.卷积提出背景在全连接网络[1]中，一张图片上的所有像素点会被展开成一个1维向量输入网络，如图1 所示，28 x 28的输入数据被展开成为784 x 1 的数据作为输入。图1 全连接网络图图2 图片转换为1维向量1000×10001061000×1000×1061012为了解决上述问题，引入卷积（Convolution）来对输入的图像进行特征提取。卷积的计算范围是在像素点的空间邻域内进行的，因此可以利用输入图像的空间信息；

卷积（Convolution）介绍——从数学基础到深度学习应用

热门推荐

Microstrong

07-06

4万+

微信公众号（1）公式：假设：输入图片（Input）大小为I*I，卷积核（Filter）大小为K*K，步长（stride）为S，填充（Padding）的像素数为P，那卷积层输出（Output）的特征图大小为多少呢? 可以得出推导公式： O=（I-K+2P）/S+1 （2）例子：我们采用的卷积核大小为K=3*3，填充大小为P=1，步长为S=2。对5*5的输入特征图进行卷积生成3*3...

理解CNN卷积计算

xiaokui50的博客

08-27

233

为什么要加padding：解决两个问题： 1. 输出缩小。比如当你有100层深层的网络，如果图像每经过一层都缩小的话，经过100层网络后，你就会得到一个很小的图像。 2. 图像边缘的大部分信息都丢失了。什么是padding. 在图像边缘填充一圈像素。公式为：输入：n（原图像像素nn）f(卷积核的大小ff),p（填充的像素个数）输出：（n+2p-f+1）*(n+2p-f+1) 如果想让...

【深度学习】卷积计算后输出维度计算方法

杨小浩浩的博客

12-22

9616

卷积运算深度学习中，利用卷积核对图片提取特征已经十分常用且普遍，本文介绍经过卷积运算后的输出维度计算方法。卷积输出维度计算已知：假设输入的图片尺寸：A x A 卷积核大小：K 步长Stride：S Padding大小：P 求解：输出的embedding维度B：B = (A + 2*P - K) / S + 1 逐步理解： A + 2*P (size + 2 * padding) ===> 将原图片拓展 A + 2*P - K ===> 根据卷积核大小把最后一个抛掉 (A + 2*

【机器学习300问】96、怎么理解卷积神经网络CNN中的卷积操作？

qq_39780701的博客

05-25

1818

怎么理解卷积神经网络CNN中的卷积操作？什么是卷积核？卷积运算的规则是什么？填充和步幅对卷积操作的影响？两种常见的卷积操作策略？

【人工智能基础07】卷积神经网络基础（CNN）：卷积神经网络结构、各层计算原理，以及常见卷积神经网络

hiliang521的博客

08-03

5990

卷积神经网络

计算机视觉+深度学习+卷积神经网络(CNN)+图像识别与分析卷积神经网络（CNN）是深度学习在计算机视觉领域的核心技术，主要

03-21

- **功能**：通过一系列的卷积核与输入图像进行卷积操作，提取图像中诸如边缘、纹理等基本特征。 - **参数**：卷积核的大小、步长、填充方式等。 - **类型**：常见的有二维卷积、三维卷积等。 - **特点**：卷...

CNN中卷积层输入与输出尺寸的计算细节

非晚非晚的博客

03-21

8954

输入矩阵格式：四个维度，依次为：样本数、图像高度、图像宽度、图像通道数 输出矩阵格式：与输出矩阵的维度顺序和含义相同，但是后三个维度（图像高度、图像宽度、图像通道数）的尺寸发生变化。权重矩阵（卷积核）格式：同样是四个维度，但维度的含义与上面两者都不同，为：卷积核高度、卷积核宽度、输入通道数、输出通道数（卷积核个数）...

卷积输出大小公式推导（图解，看不懂退钱）

qq_40491305的博客

06-06

1149

卷积输出大小公式推导见图

卷积神经网络输出的计算公式推导证明

qq_38109282的博客

04-07

1514

NNN：输出大小 WWW：输入大小 FFF：卷积核大小 PPP：填充值大小 SSS：步长大小可知N=(W+2P−F)/S+1N=(W+2P-F)/S+1N=(W+2P−F)/S+1 以上针对填充paddding在上下或者左右都是相等的情况，待会讨论不相等的情况推导：按照卷积核对填充后的卷积区域进行扫描分析，可知扫描区域大小：W+2PW+2PW+2P 图中第一行卷积核扫描的过程中，暂时不考虑第1次卷积核扫描，现在考虑第2次到第一行扫描结束的扫描区域大小，我称为“剩余扫描区域大小”，剩余扫描区域大小

深度学习-图片卷积输出大小计算公式

Yespon的专栏

12-12

7488

输入图片经过卷积后所得特征图大小的计算公式：先定义几个参数输入图片大小 W×W Filter大小 F×F 步长 S padding的像素数 P 于是我们可以得出 N = (W − F + 2P )/S+1 输出图片大小为 N×N 如：输入图片的shape为[10,3,227,227]，对应输入图片大小为227x227 输出num_output为96，对应通道数 Filter大小（kernel_...

cnn中输出大小及参数量计算

dao_0123的博客

04-22

549

参考1 参考2 输出计算公式为： N=(W-F+2P)/S+1 其中N：输出大小 W：输入大小 F：卷积核大小 P：填充值的大小 S：步长大小 weight * x + bias根据这个公式，即可算的最终的参数 Filter个数：32 原始图像shape：224 224 3 卷积核大小为：2*2 一个卷积核的参数： 2 2 3=12 16个卷积核的参数总额： 16 12 + 16 =192 + 16 = 208 ...

1.6卷积神经网络笔记—三维RGB图像卷积

qq_30979017的博客

03-02

1万+

1.三维立体图像（RGB三通道）的卷积运算6*6*3分别代表RGB图像的高、宽、通道数；3*3*3分别代表滤波器矩阵高、宽、通道数。图像和滤波器通道数必须相等（匹配）将3*3*3滤波器转换成立方体，一共3^3=27个数值，（按照前面章节介绍的卷积运算计算）。分别乘与滤波器对应的RGB图像三个通道的数值，再相加得到4*4输出矩阵的值。2.3*3*3滤波器作用检测某一通道的边缘特征：将3*3*3滤...

多通道输入的卷积计算

傲笑风的博客

07-08

2083

问题：一直不理解一张彩色3通道的图片，经过一个32层的33卷积核后，得到的是32通道的输出，如YOLOv3的第一层卷积层：一开始觉得，输入图片的每个通道都经过3332的卷积后都会得到32通道的输出；那么，3通道经过33*32的卷积后就会得到96通道的总输出。但是，在深度学习的规定中，输出的通道数是由卷积核的层数决定的。那么，3通道的输入经过32层的卷积后如何得到32通道的输出。该步骤如下：首先，每层卷积核分别于输入的各通道进行卷积。然后，把卷积后的多通道输出进行相加，便得到单通道输出。最后，剩余

卷积的三种模式：full、same、valid + 卷积输出size的计算

baicaiBC3的博客

01-06

475

注：Same卷积方式：卷积后的特征图大小跟卷积核大小无关，只跟卷积所用的步长有关，当卷积步长是1时，卷积前后特征图大小保持不变。