集成机器学习与重采样方法入门
1. 集成机器学习概述
集成模型能够降低模型中的偏差和/或方差。常见的集成方法有最大投票法、平均法和加权平均法。
1.1 最大投票法(Max - voting)
最大投票法通常用于分类问题,是结合多个机器学习算法预测结果的简单方法之一。在最大投票法中,每个基础模型对每个样本进行预测并投票,最终预测类别为获得票数最多的类别。
例如,在一个在线调查中,消费者用五级李克特量表回答问题。部分消费者可能给出5分,其他消费者可能给出4分等。如果超过50%的消费者给出4分,那么最终评分就是4分,这类似于取所有评分的众数。
操作步骤
- 准备工作
python import os import pandas as pd # 设置工作目录 os.chdir(".../.../Chapter 2") os.getcwd() # 下载并读取数据集 df_cryotherapydata = pd.read_csv("Cryotherapy.csv") - 查看数据
python df_cryotherapydata.head(5) - 创建投票集成模型
- 导入所需库
python from sklearn.tree import DecisionTreeClassifier f
- 导入所需库
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



