对话式深度学习基础入门-准确率 / 召回率 / F1 分数

准确率与召回率详解

最新推荐文章于 2025-12-02 20:45:02 发布

原创最新推荐文章于 2025-12-02 20:45:02 发布 · 755 阅读

CC 4.0 BY-SA版权

文章标签：

入门阶段大纲

本文通过AI对话方法，进行学习，介意勿扰。主要核心是通过聊天记录的模式，学习到基础知识。不知直觉的入门。

备注：准确率 / 召回率 / F1 分数因存在混淆矩阵，不通过聊天方法引导阅读，因为逻辑太绕了！

在机器学习中，构建分类模型后，如何客观衡量其性能并比较不同模型的优劣？

量化评估指标就是“尺子”，帮助我们从整体正确率到正负类区分能力进行全面检验，尤其在二分类任务（如垃圾邮件检测或疾病诊断）中，这些指标基于混淆矩阵（Confusion Matrix）计算，避免主观判断。后续计算方法就是解决客观衡量其性能并比较不同模型的优劣。

基础概念

直接结论

二分类常通过阈值调节 P-R：阈值升高，通常精确率↑、召回率↓；阈值降低，召回率↑、精确率↓。

具体业务按代价选择：（相关度高则假阴召回率低则假阳精确率）

与数据不平衡

假设一个二分类模型用于区分猫狗图像，测试集有7张图片：实际3张狗（正类）和4张猫（负类），模型预测结果为TP=3（实际狗预测狗）、FN=0（无漏判狗）、FP=1（1张猫误判狗）、TN=3（3张猫正确判猫）。混淆矩阵以行实际类别（狗/猫）、列预测类别（狗/猫）表示：

实际\预测	狗	猫
狗	3 (TP)	0 (FN)
猫	1 (FP)	3 (TN)

ROC 与 AUC 要点

轴含义：横轴 FPR，纵轴 TPR；通过遍历阈值得到整条曲线。
判优直觉：在同一 FPR 下 TPR 越高越好；曲线越“陡峭”越优。
AUC 解释：曲线下面积，取值常见于 0.5 到 1；0.5 近似随机猜测，越接近 1 越好；也可理解为随机抽取一对正负样本时，模型把正样本排在负样本前的概率。

Precision-Recall 与阈值权衡