模型压缩 --学习记录1

一、模型压缩的定义

定义:让模型变得更小、更快、但是精度尽可能不下降。

模型压缩的常用方法

  • 量化
  • 稀疏
  • 蒸馏
  • NAS
  • 低秩分解

二 、模型量化技术

在神经网络中,量化是一种将模型参数(权重/激活)从高精度浮点数转换为低精度整数表示的技术。
在这里插入图片描述

2.1、线性量化 - 对称线性量化

  • 线性量化:通过一个线性公式,将高精度的浮点数值映射到低精度的整数值中。其转换公式为:

q =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值