论文由三部分构成,也是韩松在博士期间的工作,相关论文与解析见下面: Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman coding。 从软件端极大的压缩网络的权重,