不同定义的区分:
1、错误率(Error Rate):
分类错误的样本数占样本总数的比例。
2、精度(accuracy):
分类正确的样本数占样本总数的比例。
3、查准率(Precision)and 查全率(Recall):
错误率和精度在我们现实生活中虽然非常常用,但是有的时候并不能满足所有的任务需要,以周志华书中的西瓜为例,假定瓜农拉来一车的西瓜,我们使用训练好的模型对这些西瓜进行判别,显然错误率衡量了有多少比例的瓜被判别错误,但是若 我们所关心的是:挑出来的西瓜中有多少比例是好瓜,或者,所有好瓜中都有多少比例被挑选出来,这个时候,错误率和精度就不能很好的衡量这个了,我们就需要其他的性能来衡量。
类似的需求在信息检索中,我们经常会关心,检索出来的信息,有多少比例是用户感兴趣的,或者用户感兴趣的信息中,有多少比例被检索出来。