fineturn过程中会出现遗忘问题
解决思路:
- 微调过程中加入通用数据
- 尽量少改模型
- 使用更大的模型
- 使用多任务进行学习
- 什么都不用做,只关注我们需要的能力
- 诊断模型的哪些参数导致某些能力丧失
数据需求

微调流程

过滤
保证数据多样性:POUGE-L值小于0.7的保留,否则去掉
去掉噪音
- 包含特定的单侧
- 同样的input,不同的output
- 太长或者太短
模型训练好之后的评估
方式一:人工方式,领域专家评估
方式二:使用好的大模型来评估
- 在所有数据中抽取一批样品,进行预测
- 人工评价
- 模型评价
- 对比人工评价和模型评价的结果
使用metric(精度等指标)