1.问题描述
使用llamafactory,训练方式dpo,模型使用chatglm3-6b,训练过程没问题
但是进行对话出现问题,有回复但没输出
查看后台信息:
TypeError: GenerationMixin._extract_past_from_model_output() got an unexpected keyword argument 'standardize_cache_format'
2.解决方案
使用4.41.2版本的transformer
pip install transformers==4.41.2
ps:搜了一些解决方案,说4.44.0版本的transformers和glm不适配,换成4.43.0,运行完会报这个错误ValueError: too many values to unpack (expected 2),最后还是换成了4.41.2