大家好,这篇文章主要和大家讨论coursra网站上斯坦福大学机器学习第6周第二部分Machine Learning System Design的课后习题。我将给出习题的大致翻译和本人的解题思路,其中可能存在错误,欢迎大家批评指正!
题意:你用正则化逻辑回归构造一个垃圾邮件分类器,垃圾邮件y=1这类,非垃圾邮件为y=0这类。你已经训练好了你的分类器,并且有1000个交叉验证数据集。预测分类和实际分类的图标如下。
请问这个分类器的recall(召回率)为多少?将答案填入下面框内,不少于两位小数。
分析:
Tables | Actuall 1 | Actuall 0 |
---|---|---|
prediction 1 | True possitive | False possitive |
prediction 0 | False Negative | True Negative |
85对应的是True possitive,890对应的是False possitive,15对应的是False negative,10对应的是True negative.召回率对应第三个公式,带入计算即可。
答案:recall = 85/(85+15)=0.85. 注意,不同学生计算的内容可能不同,看清计算recalll,accuracy,prediction,F1 score.