大模型使用-解码与部署-模型压缩方法

最新推荐文章于 2025-03-20 10:42:24 发布

一个研究技术、玄学、金融的干过码农的人

最新推荐文章于 2025-03-20 10:42:24 发布

阅读量192

点赞数 8

分类专栏：大模型文章标签：人工智能机器学习算法大模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sgliquangang/article/details/144220495

版权

大模型专栏收录该内容

33 篇文章

订阅专栏

一、简介

1、模型压缩方法

模型蒸馏
模型剪枝

2、实际压缩方式

通过精简模型机构，进而减少参数量

二、模型蒸馏

1、简介

概念：将复杂模型（又称教师模型）包含的知识迁移到简单模型（又称学生模型）中，从而实现模型压缩
蒸馏损失函数：用于模型蒸馏，蒸馏损失函数和分类损失函数（又称交叉熵损失函数）常一起用于训练学生模型
核心思想：引入额外的损失函数（蒸馏损失函数、分类损失函数），训练学生模型的输出尽可能接近教师模型输出

2、传统知识蒸馏

基于反馈的知识蒸馏：让学生模型输出的logits去近似教师模型的logits，进而通过这种方式让学生模型学习到教师模型的特有知识
基于特征的知识蒸馏：使用教师模型中间层的激活值作为监督信息训练学生模型

3、大模型知识蒸馏

蒸馏方法分类：
- 分类依据：根据大模型的权重数据是否可以获得
分类情况：
- 白盒模型蒸馏方法：获取模型权重来指导学生模型
- 黑盒模型蒸馏方法：使用模型输出来训练学生模型

三、模型剪枝

1、目的

在不损失模型性能的情况下，努力削减模型参数两，以见尽量降低模型对于算力与显存的消耗

2、传统剪枝方法

结构化剪枝：旨在去除对于模型性能影响较小的组件，可以删除神经元、通道、中间层
非结构化剪枝：去除模型权重矩阵中不重要的数值

3、大模型剪枝方法

结构化剪枝：与传统方式类似
非结构化剪枝：容易获得更高压缩率

一个研究技术、玄学、金融的干过码农的人

博客等级

码龄13年

412
原创

1138
点赞

1106
收藏

1038
粉丝

关注

私信

热门文章

分类专栏

大模型 33篇
玄学 7篇
中间件、工具 17篇
编程基础 1篇
管理、情商、格局 3篇
数码 3篇
项目管理 1篇
后端 4篇
办公 8篇
算法 23篇
Java 42篇
产品 1篇
区块链 1篇
Linux 11篇
C、C++ 2篇
前端 1篇
iOS 151篇
python 1篇

展开全部收起

最新评论

直播-rtmp拉流测试地址
青春向前: 第一个没拉到，第二个拉到了
Java-设计模式
倾听一世，繁花盛开: 写的太完美了，互关一下吧
codeblock couldn‘t create project directory ：path
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS 数据库升级
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS 数据库升级
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。