
机器学习框架
dustless927
这个作者很懒,什么都没留下…
展开
-
神经网络量化
前言神经网络在图像、语音识别等领域使用越来越广泛,大部分实时性要求不高的服务都可以部署在云上,然而还是有不少模型需要在计算能力有限的可移动设备上快速运行,如人脸解锁、拍照视频的实时处理等。一般训练的模型采用的都是32位浮点数,考虑到大部分的模型都具有比较强的抗噪能力,即即使输入受到了一定的干扰,最后预测出正确的结果,所以在手机等智能设备上,可以通过适当降低精度而基本影响结果的正确率,来达到加速...原创 2019-06-23 16:31:47 · 7257 阅读 · 1 评论 -
QuantizedAdd的实现
量化op一般而言,量化后的op,输入为一组或多组[input(uint8), input_min(float), input_max(float)],输出为一组或多组[output(uint8/int32), output_min(float), output_max(float)]。量化后的op实现的要点在于,如何使用量化后的定点数值进行相应的运算(尽量避免批量的浮点数运算,否则在DSP...原创 2019-06-23 16:33:53 · 421 阅读 · 0 评论