LoRA 系列篇

LoRA 系列篇

一、LoRA篇

什么是 LoRA?

  • 介绍:通过低秩分解来模拟参数的改变量,从而以极小的参数量来实现大模型的间接训练。

LoRA 的思路是什么?

  1. 在原模型旁边增加一个旁路,通过低秩分解(先降维再升维)来模拟参数的更新量;
  2. 训练时,原模型固定,只训练降维矩阵A和升维矩阵B;
  3. 推理时,可将BA加到原参数上,不引入额外的推理延迟;
  4. 初始化,A采用高斯分布初始化,B初始化为全0,保证训练开始时旁路为0矩阵;
  5. 可插拔式的切换任务,当前任务W0+B1A1,将lora部分减掉,换成B2A2,即可实现任务切换;
    在这里插入图片描述

LoRA 的特点是什么?

  • 将BA加到W上可以消除推理延迟;
  • 可以通过可插拔的形式切换到不同的任务;
  • 设计的比较好,简单且效果好;

简单描述一下 LoRA?

LoRA的实现思想很简单,就是冻结一个预训练模型的矩阵参数,并选择用A和B矩阵来替代,在下游任

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xianghan收藏册

极简精品作,一分也是一份鼓励哦

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值