微调chatglm 报错RuntimeError: expected scalar type Half but found Float
1. 背景
博主显卡:3090
最初的设置:bfloat16
开始训练后,线性层报错
2. 解决: 统一代码中所有精度
1)将模型和数据精度都设置为torch.float32/torch.float16
xxx = torch.tensor(xxx, dtype=torch.float32)
model.config.torch_dtype = torch.float32
2)将模型参数都设置为torch.float32/torch.float16
for param

博主在使用bfloat16精度训练ChatGLM时遇到RuntimeError,解决方法是统一代码中的精度设置,包括模型和数据转换为torch.float32,以及确保模型参数也调整为兼容类型。
最低0.47元/天 解锁文章
3006

被折叠的 条评论
为什么被折叠?



