- 博客(2)
- 收藏
- 关注
原创 量化基础知识
量化是指将神经网络前向推理过程中浮点数运算量化为整数运算,以达到计算加速的目的。通常是指将float32转化为int8进行运算,这样做会有更小的模型体积,可将模型大小减少 4 倍;更快的计算速度,与float32计算相比,int8计算速度通常快 2 到 4 倍。
2023-04-18 16:57:17
2268
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅