
模型加速
爆米花好美啊
个人网站: renguanghui.com
展开
-
Mobilenet v1/2和Shufflenet v1/v2
好久没写深度学习方面的文章了,偷闲再写一篇衡量指标FLOPS:floating point operations per second,每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。FLOPs:floating point operations,浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。MACC: Multiply–accumulate operatio...原创 2019-04-10 17:32:00 · 1047 阅读 · 0 评论 -
int8量化和tvm实现
量化主要有两种方案直接训练量化模型如Deepcompression,Binary-Net,Tenary-Net,Dorefa-Net对训练好的float模型(以float32为例)直接进行量化(以int8为例),这边博客主要讲这个int8量化原理将已有的float32型的数据改成A = scale_A * QA + bias_A,B类似,NVIDIA实验证明可以去掉bias,即A ...原创 2019-05-17 16:55:23 · 6515 阅读 · 4 评论