CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的

最新推荐文章于 2024-12-29 14:51:42 发布

zouxiaolv

最新推荐文章于 2024-12-29 14:51:42 发布

阅读量1.7k

点赞数

分类专栏：网络模型深度学习卷积网络架构文章标签：深度学习算法卷积

原文链接：https://www.zhihu.com/question/65305385

版权

网络模型同时被 2 个专栏收录

15 篇文章

订阅专栏

深度学习卷积网络架构

8 篇文章

订阅专栏

看到有人对flops有疑惑，先捋清这个概念。

FLOPS：注意全大写，是floating point operations per second的缩写，意指每秒浮点运算次数，理解为计算速度。是一个衡量硬件性能的指标。

FLOPs：注意s小写，是floating point operations的缩写（s表复数），意指浮点运算数，理解为计算量。可以用来衡量算法/模型的复杂度。

网上打字很容易全小写，造成混淆，本问题针对模型，应指的是FLOPs。

each MAC contains one multiplication and one addition.

————————————————————————————————————————

描述一个深度学习框架/模型，除了它的精度，通常用Forward Pass计算量和参数个数（#Parameters）来描述复杂度

前者描述了所需的计算力

后者描述了所需的内存

1、深度学习框架FLOPs的概念（即：浮点运算数量；也可以用MAC表示:each MAC contains one multiplication and one addition.）https://github.com/sovrasov/flops-counter.pytorch/issues/16

paper里比较流行的单位是GFLOPs：1 GFLOPs = $10^{9}$ FLOPs （即：10亿次浮点计算）

2、深度学习框架FLOPs的组成

1、卷积运算Conv

用以下动图中直观的解释：

image大小：5*5

卷积核大小：3*3

举例：一次3*3的卷积（求右图矩阵的一个元素的值）所需的运算量：（3*3）个乘法+（3*3-1）各加法 =17

得到3*3大小的特征图尺寸：17*9 = 153

1）bn

2）linear

3）上采样

4）poolings

5）relu

Conv占的比重最大，此外他和输入图像的大小也有关系

而#Parameters和图像大小没有关系

3、计算Forward Pass计算量和参数个数（#Parameters）的代码（基于pytorch）

https://github.com/Lyken17/pytorch-OpCounter

https://github.com/sovrasov/flops-counter.pytorch

4、常用框架的复杂度

博客等级

码龄8年

338
原创

822
点赞

3742
收藏

237
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Rotate to Attend: Convolutional Triplet Attention Module

下一篇：: 关于怎么使用预训练参数的问题，没有办法在ImageNet上训练？

最新评论

为整数线性规划(integer linear programming,ILP)
Zaylie: 1.5万+的访问量是什么鬼
torch.argmax中dim详解
做个铁憨憨537: a是两个3×4的数组，a.shape = torch.Size([2, 3, 4]) ①若b = torch.argmax(a, dim=0)，则a在第一个维度上作比较，也就是a[0][x][y]与a[1][x][y]比较，前者大，取第一维的索引0，后者大取第二维的索引1，因为x取0，1，2，y取0，1，2，3，所以最后的结果是一个3×4的数组，此数组由a的第一维的所有索引，也就是0和1组成； ②若b = torch.argmax(a, dim=1)，则a在第二个维度上作比较，也就是a[x][0][y]、a[x][1][y]、a[x][2][y]三者比较，哪个大取哪个的索引，因为x可取0，1，y可取0，1，2，3，所以结果是一个2×4的数组，此数组完全由第二维的索引组成； ③若b = torch.argmax(a, dim=2)，则a在第三个维度上作比较，也就是a[x][y][0]、a[x][y][1]、a[x][y][2]、a[x][y][3]三者比较，哪个大取哪个的索引，因为x可取0，1，y可取0，1，2，所以结果是一个2×3的数组，此数组完全由第三维的索引组成。
关于建立Lite-HRNet实验环境的问题
zouxiaolv: deep learinng human pose estimation 代码里面有
关键点检测——热图标签（Ground Truth）构建
lonelygoose256: 佬，有没有直接在原图上展现关键点热图的代码呀？
关于建立Lite-HRNet实验环境的问题
lonelygoose256: 还想请问一下大佬有没有生成人体关键点热图的代码和对应的npy文件呀？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。