LLM入门课#04-大模型的微调技术

LLM入门课#04-大模型的微调技术

大家经常会听到大模型这个概念,实际上这些通用大模型的训练非常依赖硬件的资源情况,你可能听过某某公司又买了几百张卡用于模型训练,某公司又构建了一个多大的数据中心,这些对于我们普通人来说是非常不容易的。下面有一张图用来展示一个模型构建过程中所占用的资源情况,除了模型本身的参数之外,还有梯度、优化器的状态等其他的需要占用到资源的情况。

image-20250314144250328

所以,微调是一个非常关键的技术,通过少量的资源在你的特定任务上进行训练。一些技术会稍微更新修改其中的一些参数,另外一些技术中会在原有的模型基础上添加一些层来完成,通过这种方式来避免模型出现的灾难性遗忘的问题。适合于特定任务的训练,比如a适合问答,b适合总结。

image-20250314144603111

相当于原先有个基础模型,基础模型有基础的认知能力,在这个基础模型上,对各个子任务进行微调,微调之后可以让你们的模型整体非常强大,每次当有不同的任务来到的时候,模型就会适配使用不同的头部。

image-20250314144758072

高效参数微调<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肆十二

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值