【论文学习笔记-3】ABC Net(Accurate Binary Convolutional Neural Network)
核心思想
用多个二值矩阵的基通过线性组合来达成对全精度Weight及Activation的最佳逼近。
Related Works
Quantized Neural Networks:
通过控制W的Bitwise来减少计算量和空间消耗,但是只在小数据集上表现较好(Cifar10,SVHN),但在大数据集(ImageNet)上分类效果不佳,有实验显示当精度小于4-Bit时准确度会快速下降。Cai等人通过解决了Gradient Mismatch Problem强化了低Bitwise模型,但是还有上升空间
Binarized Newral Networks:
主要提到BNN和XNOR-net,好处是降低了存储空间的消耗和power efficiency,但是精度都掉的很快。
受以上启发,本文提出了用多二值矩阵基线性组合逼近全精度精确度的想法,且使用了多重二值激活的做法,且在ImageNet上效果良好。
Methods
两种逼近方案:
- 逼近整个W
- 逐个channel逼近的方式逼近W
逼近方案:
用M个二值矩阵Bi做基,权重分别为αi(i=1,…,M),逼近方案为:
其中w是向量化的的W,B的第i列是Bi的向量化,α等于[α1,…,αM]T
可以通过数值方法得到局部最优解,但是不能由其进行反向传播并更新全精度的Filter权重,故直接定义