准确率:指分类正确的总样本个数的比例
精准率:指分类正确的正样本个数占分类器判定为正样本的样本个数的比例
召回率:分类正确的正样本个数占真正的正样本个数的比例
为了综合评估一个排序模型的好坏,不仅要看模型在不同TopN下的精准率和召回率,而且最好的绘制出模型的P-R曲线。
P-R曲线的横轴为召回率,纵轴为精准率。
在用P-R曲线评估模型时,只用某个点对应的精准率和召回率时不能全面的衡量模型的性能,只有通过P-R曲线的整体表现,才能够对模型进行更为全面的评估
均方根误差:
一般情况下,RMES能够很好的反映回归模型预测值于真实值的偏离程度,但是在实际问题中,如果存在个别偏离程度非常大的离群点时,即使离群点数量非常少,也会让RMES指标表得很差。针对这个问题解决方案:
1、认定这些离群点是“噪声点”的话,就需要在数据预处理的阶段把这些噪声点过滤点
2、如果不认为这些离群点是噪声点,那就进一步需要提高模型的预测能力,这些离群点产生的机制建模进去。
3、找个更好的指标来评估模型,而平均绝对百分比误差(MAPE)它相当于把每个点的误差进行了归一化,降低个别离群点带来的绝对误差的影响
ROC曲线:作为评估二分类器最重要的指标之一。
ROC曲线的横坐标为假阳性率(FPR)和纵坐标为真阳性率(