机器学习笔记 - 什么是模型量化压缩技术?

本文介绍了AI模型量化的概念,旨在减小模型大小、提升计算速度和降低功耗。通过将浮点数转换为整数,尤其是对边缘设备上的部署,量化能有效解决存储、计算和功耗问题。量化计算包括对称和非对称方法,其目标是在保持模型性能的同时减少精度损失。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、简述

        我们都知道现实世界是连续的状态,而计算机世界是离散的状态,这是什么意思呢?我们看一下下图,最右边的马力欧(高清)的状态,可以想象现实世界是连续的状态,而电脑世界在图像上呈现的是一格一格子的状态(左图)是离散的状态。

        所以在计算机世界如果想要图片越清晰,最简单的方式就是图的格子的数量要越多越好。

        对于AI模型也同样道理,我们可以将AI模型想成是800万画素的图片,有没有办法将AI模型弄成30万画素,然后人眼还看不出差异呢。

        最简单的方法就是把模型的浮点数换成整数,float转换integer,就是量化概念的核心(不过不光是浮点数转整数,还有单精度转半精度等等,这里用整数,就是为了简化概念说明)。浮点转整数,就是123.456789取整数(或者4舍5入),变成123。

二、

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值