文章目录 Finetune 简介 微调数据集 微调方案 LoRA & QLoRA XTuner 介绍 8GB显存玩转LLM InternLM2 1.8B 模型 多模态LLM微调 动手实战环节 课程文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md Finetune 简介 两种Finetune范式:增量预训练微调、指令跟随微调 微调数据集 上述是我们所期待模型回答的内容,在训练时损失的计算也是基于这个。 训练数据集看起来是这样,但是真正喂给模型的,是经过对话模板组装后的 下图中: <|System|>,|<User>|等对话模板