自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

a_dreaming的博客

清水阁散人

博客等级

码龄7年

23
原创

222
点赞

400
收藏

158
粉丝

关注

私信

热门文章

分类专栏

最新评论

LoRA微调GLM-4、Qwen2
清水阁散人: 当𝐴=0时，𝐵𝐴=0，这意味着在微调的初始阶段，LoRA模块对模型输出没有贡献。这看起来与初始化𝐵为0的效果相似，但实际上，梯度传播会受到影响。因为在反向传播过程中，权重矩阵的梯度计算涉及链式法则，即后一层的梯度与前一层的权重相乘。如果𝐴=0，则无论𝐵的值如何，𝐵𝐴的梯度对𝐵的更新将非常小，甚至为零。这是因为任何矩阵与0矩阵相乘的结果都是0矩阵
LoRA微调GLM-4、Qwen2
不吐桔子皮: 为什么初始化时不设置A是全0矩阵，B是高斯分布？这部分的解释没懂，我理解这个反过来初始化达到的效果不是一样的吗
LoRA微调GLM-4、Qwen2
落生花: 新的很好，很有帮助。
云服务器大数据高可用集群搭建-----hadoop篇
清水阁散人: 每个虚拟机都可以有快照的，每快照一次，就相当于有1个副本。
云服务器大数据高可用集群搭建-----hadoop篇
m0_74206166: 可以用快照来复制每个虚拟机吗

spark

关注

文章平均质量分 91

关注数：文章数：4 文章阅读量：15890 文章收藏量：130

作者: 清水阁散人

这个作者很懒，什么都没留下…

展开