32、特征与模型集成:机器学习的强大组合

特征与模型集成:机器学习的强大组合

1. 特征选择与构建

在机器学习中,特征是我们观察数据的重要工具,不同类型的特征有着不同的特点和用途。

1.1 特征类型
  • 分类特征 :也称为名义或离散特征,既没有顺序也没有尺度。
  • 有序特征 :有顺序但没有尺度。
  • 定量特征 :在定量尺度上表达,可计算多种统计量,如均值、中位数、众数、方差、标准差等。在机器学习中,定量特征常被称为连续特征,但这个术语不太恰当,因为它错误地暗示了其定义特征具有无限精度。而且,定量特征不一定具有加法尺度,例如表达概率的定量特征是在乘法尺度上的,对于非加法特征使用欧几里得距离是不合适的。
1.2 特征选择方法
  • 过滤式方法 :基于特征的个体优点评估特征,例如信息增益。但有时单个特征的信息增益可能为零,即使它们的组合可能是一个完美的分类器。例如,考虑两个布尔特征,一半的正样本两个特征值都为真,另一半都为假,而所有负样本的特征值相反。在这种情况下,每个特征单独的信息增益为零,不太可能被特征过滤器选中。
  • 包装式方法 :评估特征集,通常将特征选择“包装”在一个搜索过程中,涉及使用候选特征集训练和评估模型。常见的有前向选择法和后向消除法。前向选择法从空特征集开始,逐个添加能提高模型性能的特征;后向消除法从完整特征集开始,逐个移除能提高性能的特征。由于特征子集数量呈指数级增长,通常采用“贪
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值