模型压缩——重参数化

最新推荐文章于 2025-05-24 23:32:40 发布

入坑&填坑

最新推荐文章于 2025-05-24 23:32:40 发布

阅读量1.1w

点赞数 11

CC 4.0 BY-SA版权

文章标签：深度学习神经网络机器学习

本文链接：https://blog.youkuaiyun.com/weixin_39994739/article/details/123872722

本文介绍了重参数化技术在深度学习模型压缩中的应用，通过RepVGG、ACNet和DBB等方法减少计算量和参数数量。重参数化允许在训练时使用复杂的多分支网络，而在测试时合并为单一路径，提高运行速度。文章详细探讨了不同重参数化策略，如1x1 Conv与KxK Conv的融合、串联与并联融合，以及在ResNet和MobileNetV2结构中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

模型压缩——重参数化

重参数化

模型压缩主要的方法有：重参数化、剪枝、量化等，本章主要讲重参数化
在解决恒等映射时对卷积核插值或者重新生成一个卷积核时有些会直接使用Dirac初始化增加的权重。
Dirac初始化看这里：https://www.e-learn.cn/topic/1523429

重参数化

重参数化有并行合并和串行合并(主要是为了合并模块成一个卷积)，要想合成只有一条，那要先串行再并行，而且串行合并的那一块不能有ReLU，sigmoid、tanh这种公式只有一种的可以，ReLU为在x>0和x<0的公式不同所以不行。
优点：训练时采用多分支的网络使模型获取更好的特征表达，测试时将并行融合成串行，从而降低计算量和参数量，提升速度(融合后理论上和融合前识别效果一样，实际基本都是稍微降低一点点)

RepVGG 和ACNe的重参数化方法

ACNet

在add中： $w1\cdot x+w_2\cdot x=(w_1+w_2)\cdot x$
在这里插入图片描述
在这里，1x3 Conv等于第二行和第三行权值为0的3x3 Conv，3x1 Conv等于第二列和第三列权值为0的3x3 Conv。
那么，此时图中的3个尺寸不同Conv就可以等价于3个尺寸都相同的卷积了，也就可以应用上面add的公式了。
实际上Conv后会后BN，BN和Conv的融合看底下的RepVGG