14、机器学习中的特征选择、模型持久化与支持向量机应用

机器学习中的特征选择、模型持久化与支持向量机应用

1. 特征选择

特征选择可被视为参数调优在特征层面的类比。如同通过交叉验证找到合适的通用参数一样,我们也能找出合适的特征子集。这涉及多种方法,其中最简单的是单变量选择,其他方法则涉及特征组合。

特征选择还有一个额外好处,即减轻数据收集的负担。例如,若在一小部分数据上构建了模型,后续要扩展到整个数据集进行预测时,特征选择可减少数据收集的工程工作量。

1.1 单变量特征选择
  • 准备数据
from sklearn import datasets
X, y = datasets.make_regression(1000, 10000)
  • 计算得分和 p 值
from sklearn import feature_selection
f, p = feature_selection.f_regression(X, y)

这里的 f 是每个单特征线性模型的 f 得分, p 是与 f 值相关的 p 值。在统计学中,p 值是比当前测试统计量更极端值的概率,这里 f 值就是测试统计量。


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值