机器学习技术比较与遗传算法详解
1. 机器学习技术比较
在处理分类识别问题时,我们常常需要判断两种不同的机器学习技术哪一种更适合。下面将介绍比较两种机器学习技术的实验方法以及相关的统计评估原理。
1.1 实验方法:5x2 交叉验证
5x2 交叉验证是一种用于比较两种机器学习算法的实验方法。具体操作步骤如下:
- 将可用的预分类数据划分为两个大小相等的子集,分别记为 T11 和 T12。
- 首先,使用这两个机器学习技术从 T11 中诱导出分类器,然后在 T12 上对这些分类器进行测试。
- 接着,从 T12 中诱导出两个分类器,并在 T11 上进行测试。
- 重复上述过程五次,每次都将数据集随机划分为不同的两个子集 Ti1 和 Ti2。
通过这种方法,我们可以得到十对测试集的分类准确率(或错误率、精度、召回率等其他性能指标)。接下来需要判断这十对结果之间的差异是否具有统计学意义。
1.2 实验结果示例
假设我们正在比较两种机器学习算法 ML1 和 ML2,经过十次实验运行后得到的结果如下表所示:
| 测试集 | T11 | T12 | T21 | T22 | T31 | T32 | T41 | T42 | T51 | T52 |
|---|
超级会员免费看
订阅专栏 解锁全文
446

被折叠的 条评论
为什么被折叠?



