大语言模型之十四-PEFT的LoRA

shichaog

已于 2023-11-22 14:37:02 修改

阅读量5.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：神经网络&人工智能文章标签：语言模型人工智能自然语言处理

于 2023-10-03 20:00:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shichaog/article/details/133454688

神经网络&人工智能专栏收录该内容

30 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

在《大语言模型之七- Llama-2单GPU微调SFT》和《大语言模型之十三 LLama2中文推理》中我们都提到了LoRA（低秩分解）方法，之所以用低秩分解进行参数的优化的原因是为了减少计算资源。

我们以《大语言模型之四-LlaMA-2从模型到应用》一文中的图3 LLama-2 图例过程为例说明内存的消耗。首先是有32层的Transformer，它们每层的内存占用如下图：
在这里插入图片描述
图中有六个大矩阵是打了勾的，原始的LLama2中矩阵的维度是4096*4096，单精度是float（4字节），那么一个矩阵的消耗将是64MB，七个矩阵大约是448MB，共计三十二层，那么总计消耗的内存将约16GB，在训练的时候还要计算梯度和学习率，需要的内存量将是翻倍的大小。例如参数量为1750亿Bloom的，其推理需要约350GB内存。

所以有没有什么办法能够减少内

了解本专栏

超级会员免费看

博客等级

码龄16年

288
原创

1553
点赞

3958
收藏

2932
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 大语言模型之十三 LLama2中文推理

下一篇：: 大语言模型之十五-预训练和监督微调中文LLama-2

最新评论

语音合成之十八为什么在招的TTS算法岗比ASR多？
苏黎世的铁盒: TTS应用市场大啊，直播，配音，甚至缅甸的诈骗分子，都希望迅速摸透。asr要求的是精确性高，而TTS的可拓展性决定了他的应用场景丰富多样
腿足机器人之十- SLAM地图如何用于运动控制
shichaog: 腿足就是模拟人和动物的，从理论上讲，复杂地形中的适应性上限是超过人类的， SLAM主要作用是帮助机器人和规划路径和感知地表，良好的路径规划直接影响到机器人的行动效率、避障能力和安全性；感知地表可以帮助机器人调整其稳定性控制策略，确保在不平、湿滑、雪地、坑洼等行走过程中的稳固性。
腿足机器人之一- 机械与电子组件概览
shichaog: 机械结构、电子系统以及两者的协同作用三个方面，机械结构决定物理极限，电子系统赋予智能控制能力，而两者的协同优化（如轻量化+低延迟）是提升灵活性和适应性的关键。未来的突破将依赖于新材料、高密度驱动器和AI算法的进一步融合。
腿足机器人之一- 机械与电子组件概览
征途黯然.: 腿足机器人的机械与电子组件如何影响其运动性能和灵活性？
第四章神经网络声码器
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619533869。

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shichaog 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。