上篇讲述了卷积神经网络网络压缩的理论基础,包含filter层面、channel层面、group层面和稀疏矩阵。
本篇博客将总结一下低秩估计的方法,低秩估计主要分为矩阵分解和张量分解。
一、矩阵分解
如上图中两个矩阵相乘,每个向量相乘所需要的计算次数为b个乘法,b-1个加法,共a*c*(2b-1),通常情况下加法的速度比乘法的速度快很多,并且后面求比例时可以约掉,为了方便计算,计算为a*b*c。
SVD分解后,参数压缩比为
卷积核矩阵可以通过SVD分解为如下:
上图中的a在为, b为