机器学习中的集成学习方法及应用
1. 堆叠集成方法概述
在机器学习中,堆叠集成是一种强大的技术,它通过组合多个基础模型的预测结果,利用元学习器来提高整体预测的准确性。下面我们将详细介绍堆叠集成的相关内容。
1.1 基础模型预测与评估
首先,我们使用基础模型对测试子集进行预测,得到预测结果 final_test_stack ,并将其转换为 DataFrame 格式的 stacked_test_dataframe 。该 DataFrame 包含三列,分别对应高斯朴素贝叶斯(NB)、K近邻(KNN)和决策树(DT)这三个基础模型在测试子集上的预测值,列名分别为 NB_TEST 、 KNN_TEST 和 DT_TEST 。
接下来,我们检查这些基础模型在原始测试子集上的准确率,结果如下:
| 模型 | 准确率 |
| ---- | ---- |
| 高斯朴素贝叶斯 | 0.39 |
| K近邻 | 0.69 |
| 决策树 | 0.73 |
然后,我们使用元学习器模型对堆叠后的测试数据进行预测,并检查其准确率,得到的准确率为 0.77,高于各个基础模型。需要注意的是,简单地增加基础模型的数量并不能保证获得更好的准确率。
1.2 相关工具库
为了简化堆叠模型的构建过程,有一些工具库可供使用:
- mlxtend 库
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



