深度学习模型的压缩和加速是指利用神经网络参数的冗余性和网络结构的冗余性精简模型,在不影响任务完成度的情况下,得到参数量更少、结构更精简的模型。被压缩后的模型计算资源需求和内存需求更小,相比原始模型能够满足更加广泛的应用需求。在深度学习技术日益火爆的背景下,对深度学习模型强烈的应用需求使得人们对内存占用少、计算资源要求低、同时依旧保证相当高的正确率的“小模型”格外关注。利用神经网络的冗余性进行深度学习的模型压缩和加速引起了学术界和工业界的广泛兴趣,各种工作也层出不穷。
本文参考2021发表在软件学报上的《深度学习模型压缩与加速综述》进行了总结和学习。
相关链接:
总结
| 模型压缩与加速技术 | 描述 |
|---|---|
| 参数剪枝(A) |

本文详细介绍了深度学习模型压缩中的低秩分解技术,包括二元分解和多元分解方法,如卷积核的二元分解、Tucker分解和CP分解等,这些方法通过降低参数维度和计算复杂度,实现模型的压缩和加速,适用于大卷积核和中小型网络,但在小卷积核场景下应用受限。
最低0.47元/天 解锁文章
861

被折叠的 条评论
为什么被折叠?



