一、Finetune Finetune分为两种范式:增量预训练和指令跟随是经常会用到两种的微调模式 增量预训练微调 使用场景:让基座模型学习到一些新知识,如某个垂类领域的常识训练数据:文章、书籍、代码等 指令跟随微调 使用场景:让模型学会对话模板,根据人类指令进行对话训练数据:高质量的对话、问答数据 原始数据需经过标准化、添加对话模板、tokensize数据、添加Label之后用于训练。 原始数据实例: 对话模板