2.4 比较检验机器学习

盛寒

已于 2024-03-28 14:19:29 修改

阅读量1.9k

点赞数 16

CC 4.0 BY-SA版权

分类专栏：机器学习西瓜书文章标签：机器学习人工智能

于 2024-03-28 14:16:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2403_83073833/article/details/137055870

目录

常见比较检验方法

2.4.1 假设检验

2.4.2 交叉验证T检验

2.4.3 McNemar 检验

接我们的上一篇《性能度量》，那么我们在某种度量下取得评估结果后，是否可以直接比较以评判优劣呢？实际上是不可以的。因为我们第一，测试性能不等于泛化性能，第二，测试性能会随着测试集的变化而变化，第二，很多机器学习算法本身有一定的随机性，即便用相同参数设置在同一测试集上其结果也会不同所以直接选取相应评估方法在相应度量下比大小的方法不可取。

常见比较检验方法

统计假设检验 (hypothesis test) 为学习器性能比较提供了重要依据。即比较两算法性能是否相同。一般我们假设两算法性能一样，很显然，若拒绝，则性能不一样，若没拒绝则性能一样。（参见《概率论与数理统计》中假设检验）

两学习器比较：

1.交叉验证 t 检验 (基于成对 t 检验) k 折交叉验证； 5x2交叉验证

2.McNemar 检验 (基于列联表，卡方检验)

多学习器比较：

1.Friedman检验 (基于序值，F检验; 判断“是否都相同”)

2.Nemenyi 后续检验 (基于序值，进一步判断两两差别)

总述

首先我们比较两个学习器的时候，假设我们两学习器一样的性能，我们基于一个值来评估，那么我们在多个测试集中得出的两学习器的误差的差的均值近似为0.显然我们判断此种情况时符合我们的T检验。对于我们的多个值评估，我们使用联列表（记得上次那个TP,NP的表吗？这就类似于那个）假设我们有两个学习器，对于同一组样本，我们的联列表如下：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。