机器学习分类器评估与优化全解析
1. 评估指标:F1 分数
F1 分数是衡量分类器性能的重要指标,其计算公式为:
[ F1 = \frac{2}{\frac{1}{precision} + \frac{1}{recall}} = \frac{2 \times precision \times recall}{precision + recall} = \frac{2 \times TP}{2 \times TP + FN + FP} ]
要计算 F1 分数,可使用 f1_score() 函数,示例代码如下:
from sklearn.metrics import f1_score
f1_score(y_train_5, y_train_pred)
F1 分数倾向于那些精确率和召回率相近的分类器。但在不同场景下,我们对精确率和召回率的侧重点不同。例如:
- 儿童安全视频检测 :更注重精确率,宁愿拒绝一些好视频(低召回率),也要确保只保留安全的视频(高精确率)。
- 商场扒手检测 :更看重召回率,即使精确率只有 30%,只要召回率达到 99% 就可以接受,这样能确保几乎所有扒手都被抓获。
然而,精确率和召回率是相互制约的,提高精确率会降低召回率,反之亦然,这就是精确率/召回率权衡问题。
2. 精确率/召回率权衡
2.1 SGDClassifier 决策原理
SGDClassi
超级会员免费看
订阅专栏 解锁全文
2593

被折叠的 条评论
为什么被折叠?



