假设有100个样本,其中正样本70,负样本30,这个是由数据集本身决定的,机器要做的就是判别这100个样本中哪几个样本是正样本,哪几个样本是负样本。
现在机器做出了预测:
机器把原样本中70个正样本中的50个判为正,记为TP=50(True Positive,机器判断正确的正样本);
机器把原样本中70个正样本中的20个判为负,记为FN=50(False Negative,机器判断错误,认为该样本是负样本,但它是正样本。可以理解为“机器错误的认为它是负样本,负负得正所以它本来的面目应该是正样本”);
机器把原样本中30个负样本中的10个判为正,记为FP=10(False Positive,机器判断错误,认为该样本是正样本,但它是负样本。可以理解为“机器错误的认为它是正样本,那它本来的面目是负样本”);
机器把原样本中30个负样本中的20个判为负,记为TN=20(True Negative,机器判断正确的负样本);
accuracy=TPTP+FPaccuracy=\frac{TP}{TP + FP}accu

本文介绍了在100个样本中,机器学习模型如何预测正负样本的情况。70个正样本中,模型正确预测了50个(TP),错误预测了20个(FN)。30个负样本中,模型错误预测了10个为正(FP),正确预测了20个为负(TN)。准确率accuracy基于模型的正样本预测,而召回率recall则关注实际正样本的预测情况。
最低0.47元/天 解锁文章
2万+





