#本次学习链接为Datawhale
一、大模型微调相关知识
大模型微调技术简介
-
定义:
- 模型微调,又称为指令微调(Instruction Tuning)或有监督微调(Supervised Fine-tuning, SFT),利用成对的任务输入与预期输出数据训练模型,使其能以问答形式解答问题,激活模型的任务解决潜能。
-
作用:
- 微调过程不是为模型传授新知识,而是激活模型的潜在能力,帮助模型更好地遵循指令,解决多种下游任务。
-
数据需求:
- 相比预训练,指令微调所需的数据量较少,从几十万到上百万条不等,甚至少量**高质量数据(数千至数万条)**也能实现令人满意的效果。
- 这种数据需求的减少降低了计算资源的依赖,同时提升了微调的灵活性与效率。
轻量化微调技术简介
-
背景:
- 大模型的参数量巨大,进行全量参数微调需要消耗大量的算力和计算资源。