
Quantization
张博208
知识搬运工
展开
-
神经网络加速库 QNNPACK 实现揭秘
https://zhuanlan.zhihu.com/p/81026071引言QNNPACK(Quantized Neural Networks PACKage) 是 Marat Dukhan (Facebook) 开发的专门用于量化神经网络计算的加速库。其卓越的性能表现一经开源就击败了几乎全部已公开的加速算法,甚至直至今日(2019 年中)。QNNPACK 开源时附带了一份技术博客简要介绍了其主要的实现技巧,最近开发者又发表了论文介绍其中卷积的优化方法。然两份文献过于概略,而具体代码又比较晦.转载 2020-09-11 09:37:49 · 1501 阅读 · 0 评论 -
FBGEMM 开源,用于最先进的服务器端推理
https://blog.youkuaiyun.com/yiran103/article/details/84886226转载 2020-09-11 09:29:57 · 249 阅读 · 0 评论