定点量化和无损量化

最新推荐文章于 2024-05-31 00:00:00 发布

原创最新推荐文章于 2024-05-31 00:00:00 发布 · 3.9k 阅读

31 ·

CC 4.0 BY-SA版权

文章标签：

#定点量化 #无损量化

ASIC设计专栏收录该内容

35 篇文章

订阅专栏

硬件电路里面数据位宽都是一定的。在处理数据流是，数据的位宽也是一定的。所以浮点数需要先转变成定点数进行运算。

举例说明。12.918，定点量化时对整数部分和小数部分分别量化。

（1）整数部分12，最少使用4位量化，4-bit表示范围0~15；

（2）小数部分0.918，假设12.918整体使用12位量化，整数已使用4-bit，则小数部分还能使用8-bit量化，能够表示2的8次方共计256个刻度，每个刻度的间隔是1/256 = 0.00390625，这个值也就是量化精度。

小数0.918需要多少个刻度来表示呢？ 0.918/(1/256) = 0.918*256 = 235.008，四舍五入取整，则使用235个刻度来表示，误差是0.008个刻度，误差大小是0.008*(1/256) = 0.00003125。

量化误差小于量化精度的一半，认为是“无损量化”。由于量化后误差0.00003125肯定是小于精度0.00390625的一半，所以这个误差小到可以认为是无损量化。

当使用11位量化时，同理：

（1）整数部分12，最少仍需要4位量化，4-bit表示范围0~15；

（2）小数0.918，只能使用剩下的7-bit量化，能够表示2的7次方共计128个刻度，每个刻度的间隔是1/128。

小数0.918需要多少个刻度来表示呢？ 0.918/(1/128) = 0.918*128 = 117.504，四舍五入取整，则使用118个刻度来表示，误差是-0.496个刻度，误差大小是-0.496*(1/128) = -0.003875，保留四位小数并取正数，0.0039。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

re_call

关注关注

7
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

定点浮点神经网络量化_定点量化

weixin_39914752的博客

12-22

2586

定点量化量化技术计算并存储了更加紧凑的数字格式。TensorFlow Lite 增加了使用 8 位的定点量化表示。由于现代神经网络的挑战之一是进行高精度的优化，首先要做的是改善训练期的精度和速度。使用浮点数运算是保持精度的简单方法之一，同时 GPU 也被设计为能为这些运算进行加速。然而，随着越来越多的机器学习模型需要被部署到移动设备上，推理的效率已经成为了一个关键性问题。对于训练期的计算需求，随着...

定点化与模型量化（一）

zcg1942的博客

05-17

2155

事实上，模型量化一开始就是为了压缩模型参数，韩松ICLR2016使用K-Means聚类，以类中心代替属于该类的所有样本，低bit只需要对类中心表示，从而可以使得保留更多的空间来表示更多的其他数据。既然本质上是定点化，那么模型量化的好处和定点类似，都是损失精度的代价下，有更快的速度，更小的内存，更小的功耗。以常见32bit浮点型到8bit为例，模型大小直接变成了原来的1/4，更重要的是因为使用了整型，可以使用SIMD指令集，而SIMD在移动端的优化已经非常充分了，速度可以加快2~4倍。

参与评论您还未登录，请先登录后发表或查看评论

定点数无损量化

qq_31006535的博客

05-11

6221

定点数量化量化公式例题量化公式若需要量化成的定点数格式：m位定点数，n个小数位，无符号位，那么n称作量化系数，则将一个浮点数量化成该格式的定点数公式为〖num〗_fix=floor(num_float2^n) floor为向下取整函数（舍弃小数位），该格式的定点数最小能够表示的数为1/2^n , num_fix为量化之后的m位定点数，表示的数为num_fix1/2^n 可以这样理解：量化系数n决定了我们逻辑上认为01序列中可表示的单位值为1/2^n ，而CPU读取的数字表示有多少份单位值举例来说，

对pytorch的可训练参数进行定点量化（模拟FPGA加速神经网络计算过程）：

随缘分享

10-03

4741

对pytorch的训练参数进行定点量化： PS：只是模拟FPGA实现时的定点数量化训练过程… 哪个大佬有好的量化方案，求给个连接，官网的pytorch量化训练教程看不懂，以后看懂了再更吧目录对pytorch的训练参数进行定点量化：1.建立模型2.查看模型参数3.转换公式总结 1.建立模型建立一个含有两个线性层的模型 import torch import numpy as np import torch.nn as nn class FC(nn.Module): def __init__

神经网络定点量化

smartcat2010的博客

02-13

2243

把某个tensor或者某个channel的这组float32, 用int8来表示，就是量化。这组float32的上下界，可以取他们的min和max，也可以moving average，也可以去中间99%的那部分。。。越界的就用量化为0或者255。公式： (r实数-0) / (q整数-Z整数）= S = (r实数max-r实数min) / (q整数max-q整数min) =(r实数max-r实数min) / 255 Linear层和卷积的量化：神经网络量化入门--基本原理 - 知乎 .

FPGA/数字IC秋招笔试面试006——数据定点无损量化问题（2022届）

DengFengLai123的博客

03-11

1842

【转载请注明出处】（大疆2020芯片开发工程师A卷）对12.918做无损定点化，需要的最小位宽是多少位，位宽选择11位时的量化误差是多少？ A. 12位，0.0118 B. 13位，0.0039 C. 12位，0.0039 D. 13位，0.0118 答案：C，12位，误差0.0039 解析： 12.918，定点量化时对整数部分和小数部分分别量化。（1）整数部分12 ，最少使用4位量化，4-bit表示范围0~15；（2）小数部分0.918 ，假设12.918整体使用12位量化，整数已使用4-bit，

定点浮点神经网络量化_神经网络模型量化论文小结

weixin_39682477的博客

12-22

1576

神经网络模型量化论文小结发布时间：2018-07-22 13:25,浏览次数：278现在“边缘计算”越来越重要，真正能落地的算法才是有竞争力的算法。随着卷积神经网络模型堆叠的层数越来越多，网络模型的权重参数数量也随之增长，专用硬件平台可以很好的解决计算与存储的双重需求，但目前还不成熟，存在些亟待解决的问题，没能大规模商用。对模型进行参数量化的主要目的是减小模型存储体积，加速运算，能够将算法应用在通...

量化及定点化模型压缩常见方法、特定及优缺点整理

lqfarmer的博客

02-07

632

模型压缩简答说就是将庞大的深度学习模型进行压缩，常见方法包括五大类，分别是剪枝、量化、正则化、知识蒸馏、条件计算。量化是模型压缩常用方法之一，本文不完全包括了一些神经网络Fixed-Point Training（定点化训练）相关的方法进行了详细整理，拆分，并对优缺点进行了对比分析。资源整理自网络，资源获取见源地址：https://github.com/A-suozhang/awesome-quantization-and-fixed-point-training ...

定点量化只是开始：FPGA浮点转定点精度损失的5大根源深度溯源

在FPGA的高性能计算与实时信号处理应用中，定点量化是连接算法设计与硬件实现的关键桥梁。由于FPGA缺乏原生浮点运算单元（除非使用高端型号），绝大多数涉及高精度计算的任务必须通过定点数（Fixed-Point）来近似...

端侧推理性能翻倍秘诀：NNoC加速 vs 定点量化在ESP32上的实测对比数据曝光

以ESP32为代表的微控制器单元（MCU）虽具备低功耗优势，但其有限的DSP资源和片上SRAM难以支撑高吞吐神经网络推理。典型瓶颈体现在：**计算密集型算子（如卷积）执行效率低**、**频繁的DRAM访问导致延迟激增**、以及*...

MATLAB实现的采样量化程序

11-22

本程序实现了，基于MATLAB的采样量化，对图形、图像进行采样量化

实现数据动态定点

11-11

数据链路定点化时，会涉及数据位宽的截断，此代码用m语言实现数据动态定点~~

# FPGA中定点、浮点、量化

nuonuo_fighting的博客

08-23

3483

FPGA中定点、浮点、量化 1.原码、反码、补码表示： FPGA支持定点运算和浮点运算，但是浮点运算更复杂：定点包括原码、反码、补码表示：原码：1_110表示-0.75 0_110表示0.75 补码：通常，有符号数指二进制数用补码表示，如1111表示无符号数15、有符号数表示补码：-（8-7）=-1 正数原码补码反码都一样，对于负数，原码、反码、补码均不同如-1，如果用四比特有符号数表示，则原码：1001，补码表示=-(2^3-1)=-7=1111，这里3是整数位的个数即原码补码转化原理

无损定点化，fpga数据定点化误差

yan1111112的博客

05-24

3308

无损量化：量化误差小于量化精度的一半。如：13.448 整数13，需要4位量化小数部分一直乘2，直到第一位小数小于5，满足条件，因为第一位小数小于5就说明量化误差小于精度的一半。量化精度位1/2^N,N位小数部分量化位数。 1、两位量化 0.448*4=1.792。两个的量化精度为1/4=0.25; 误差为0.792/4=0.198; 0.198/0.25=0.796》0.5,所以两位量化小数不行。 2、三位量化 1.792*2= 3.584 3、四位量化 3.584*2=7.168 四个的量化精度

数字信号处理定点数的表示以及量化问题

m0_49540263的博客

05-26

2450

字长基本问题字长（位宽）和小数部分字长共同构成了定点数的两个要素。以wl表示字长，fl表示小数部分字长，那么有符号定点数以Fix_wl_fl的形式表示，无符号定点数的字长以UFix_wl_fl的形式表示。对于定点小数，一旦wl和fl确定，那么小数点的位置即可固定。下表给出了Fix_5_3与十进制小数的对应关系：在定点小数中，有一类值得关注，那就是只有一位整数位的定点小数。下表给出了Fix_5_4与十进制小数之间的对应关系。可见，此类定点小数只能表示(-1,1)区间内的纯小数，范围受限。在表2中，

定点数无损量化方面理解

little_ox的博客

07-21

429

也有同学的不同理解，但是殊途同归，最终意思都是一致的， https://blog.youkuaiyun.com/qq_31006535/article/details/106064595 https://blog.youkuaiyun.com/CLL_caicai/article/details/108229960

定点化和模型量化（二）

zcg1942的博客

05-31

1635

一个问题是原有的激活函数是为分布在0~1的数据设计的，以sigmoid为例，浮点的时候要无限接近于1它才等于1，但量化数据很容易就大于1了，但从整个分布看这个值其实还处于比较低的水平。文章假设了BN-->relu这样的顺序结构，因此BN层得到的高斯分布，只有正半轴的部分保留了下来，此时不能直接使用BN的均值作为 E[x]。正如前面提到的，MobileNetV2的后量化会面临70.9% to 0.1%的准确度下降，但这篇文章不需要per channel量化，也不需要训练就可以得到接近原始精度的量化效果。

定点数计算(详细)

Justdoforever的博客

05-04

5688

更详细链接

【学习体会】INT8定点数和模型量化

LeonJin的博客

01-27

3313

定点，就是约定机器中数据的小数点位置固定不变。在计算机中，通常将数据的小数点固定在数据的最高位之前或者最低位之后。前者称为定点小数，后者称为定点整数。定点小数是纯小数：约定的小数点位置在符号位之后、有效数值部分最高位之前。若数据 x 的形式为 x = x0.x1x2…xn ( 其中x0为符号位，x1～xn是数值的有效部分，也称为尾数， x1为最高有效位 )，则在计算机中的表示形式为：一般说来，如果最末位 xn = 1，前面各位都为 0 ，则数的绝对值最小，即 |x|min = ..

12.918无损定点化