(1)想办法获取更多的数据。

前段时期的数据,较多呈现红色部分的数据较少呈现蓝色部分的数据;后半时期,产生数据的趋势发生变化,较多呈现蓝色部分数据较少呈现红色部分数据。所以,想办法获取更多的数据。
(2)换个评判方式
通常我们会用精度(Accuracy)和错误率(error)来评价模型的好坏。这两个指标在数据不均衡时,均不能客观的衡量模型。
解决办法:
通过Confusion Matrix,计算查准率(Precision)和查全率(recall),然后再计算F1 Score。这种衡量模型的标准可以成功的区分数据不均衡问题,并且能给出模型客观的评价。
对模型评价标准不熟悉的,可以看我之前的文章:

本文探讨了处理不均衡数据的几种方法,包括获取更多数据、改变评估标准、数据重组、选择适合的机器学习模型以及调整算法。通过精确度、查准率、查全率和F1分数来评价模型,并介绍了过采样、欠采样等技术,以及如何根据数据不平衡情况调整算法的阈值。

最低0.47元/天 解锁文章
357

被折叠的 条评论
为什么被折叠?



