现代机器学习研究进展 第二部分 模型与架构 第17章:模型压缩与结构化稀疏 —— 原理推导

本章聚焦模型压缩的数学原理与证明:包括剪枝(结构化/非结构化)、蒸馏、量化(理论与近似误差)、低秩近似与张量分解(SVD、Tucker、Tensor-Train)、以及将这些方法与推理性能(延迟/能耗)联系起来的工程化成本模型与测量方法。


17.1 概览与形式化目标


17.2 剪枝(Pruning):从 L0_00​ 最优化到近似算法

17.2.1 问题建模:掩码变量与 L0_00​ 最小化


17.2.2 非结构化幅值剪枝(magnitude pruning):动机与松弛解释

常见启发式:按权重幅值 ∣θi∣|\theta_i|∣θi​∣ 从小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值