Datawhale AI 夏令营:大模型应用开发--Task04笔记

#本次学习链接为Datawhale

一、大模型微调相关知识

大模型微调技术简介 

  1. 定义:

    • 模型微调,又称为指令微调(Instruction Tuning)有监督微调(Supervised Fine-tuning, SFT),利用成对的任务输入与预期输出数据训练模型,使其能以问答形式解答问题,激活模型的任务解决潜能。
  2. 作用:

    • 微调过程不是为模型传授新知识,而是激活模型的潜在能力,帮助模型更好地遵循指令,解决多种下游任务。
  3. 数据需求:

    • 相比预训练,指令微调所需的数据量较少,从几十万到上百万条不等,甚至少量**高质量数据(数千至数万条)**也能实现令人满意的效果。
    • 这种数据需求的减少降低了计算资源的依赖,同时提升了微调的灵活性与效率。

轻量化微调技术简介 

  1. 背景:

    • 大模型的参数量巨大,进行全量参数微调需要消耗大量的算力和计算资源。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值