训练误差与混淆矩阵

我们都知道混淆矩阵的定义,就不赘述了。
混淆矩阵通过分类模型的预测准确率或者说是错误率来评估分类模型的性能。
然而对于决策树来说,首先它是一个训练的过程,其实是没有预测行为的。然而我们知道可以根据乐观估计,也就是训练误差代替泛化误差来判断。

训练误差,在决策树最终成型之后,最终具有共同特征的大部分点代表了这个共同特征的类型,但是有些点即使也有这些特征,它们也像异类一样本身不属于这个大部分群体,但它们也被划分到了这个群体,这就是训练误差。

根据训练误差,很容易就把类划分为原本代表 a 类的被划分为 a 类的记录数;原本代表 a 类的但被划分为 b 类的记录数;原本代表 b 类的被划分为 b 类的记录数,原本代表 b 类的但被划分为 a 类的记录数……当特征数 n = 2 时,这就是混淆矩阵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值