1、最好的办法是获得更多的数据
2、换个评价标准,有一些评判指标就是专门解决样本不平衡时的评判问题的,如准确率,召回率,F1值
3、重新采样,少的重复采样,多的抽样,或者加入惩罚权重,多的权重小,少的权重大,这就跟梯度提升类似吧
梯度提升AdaBoost会把误分类样本加大权重,在表决中其较大作用
4、换个对数据平衡性要求不那么大的机器学习算法,例如决策树
1、最好的办法是获得更多的数据
2、换个评价标准,有一些评判指标就是专门解决样本不平衡时的评判问题的,如准确率,召回率,F1值
3、重新采样,少的重复采样,多的抽样,或者加入惩罚权重,多的权重小,少的权重大,这就跟梯度提升类似吧
梯度提升AdaBoost会把误分类样本加大权重,在表决中其较大作用
4、换个对数据平衡性要求不那么大的机器学习算法,例如决策树