18、传统监督学习算法详解

传统监督学习算法详解

1. 混淆矩阵与模型准确率

混淆矩阵能全面展示模型的性能,它详细列出了正确和错误预测的数量,包括真正例(TP)、真反例(TN)、假正例(FP)和假反例(FN)。其中,正确分类指的是模型正确识别类别的情况,即TP和TN。模型的准确率是指正确分类(TP和TN)在所有预测中所占的比例,可直接从混淆矩阵中计算得出。

当数据中的正例和反例数量大致相等(即类别平衡)时,准确率指标能很好地衡量模型的性能。准确率的计算公式为:
[
Accuracy = \frac{TP + TN}{TP + FP + FN + TN}
]

例如,如果模型在100个测试实例中正确识别了90个(无论正例还是反例),那么其准确率就是90%。这个指标能让我们大致了解模型在两个类别上的表现。

2. 召回率和精确率

在计算准确率时,我们并不区分TP和TN。通过准确率评估模型很直接,但当数据类别不平衡时,它无法准确量化训练模型的质量。此时,召回率和精确率这两个额外的指标能更好地量化模型质量。下面以钻石开采过程为例来解释这两个指标。

在钻石开采中,人们从河床收集沙子,经过大量清洗后,留下大量岩石。其中绝大多数是普通石头,识别出钻石是罕见但非常重要的事件。在这个场景中:
- TP :正确识别为钻石的清洗岩石
- TN :正确识别为石头的清洗岩石
- FP :错误识别为钻石的石头
- FN :错误识别为石头的钻石

<
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值