LLAMA-factory 自制数据质量低怎么办?

我自己从课本按照格式提取8k条数据,但是训练时,sft的loss值平均在2以上,评估指标bleu-4只有20%左右,而且epoch增加评估指标还会越低。我的数据集部分如下图所示,有没有遇到相同问题的,参数应该没啥错。因为我微调自带的数据集都没啥问题所以我感觉是自己数据质量低导致,具体也不知什么原因,希望有佬指点迷津,感谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值