1、样本标注时多数正样本被错误的标注为负样本,这样模型学到正例的能力变弱,这样正样本预测为负样本的同时,负样本的精度也会减少。 方法一:对错误的标注样本进行修正,观察结果,看是否有改变。 2、一般情况下,正负样本比列小于1:100(看到有的人说1:1000一下,数值还不太确定)都不算不平衡。 3、方法二:增加数据量,认为可能是数据量不够,学不上来,效果不够;特征找的不够,则会那个负样本区分力度不大,网络太浅,学不到特征。 总结 正负样本的数量不均衡!