16、机器学习中的特征选择与专家知识运用

特征选择与专家知识融合

机器学习中的特征选择与专家知识运用

1. 自动特征选择

在机器学习中,特征选择是一个重要的步骤,它可以帮助我们去除噪声特征,提高模型性能,同时减少计算成本。以下将介绍几种常见的自动特征选择方法。

1.1 单变量特征选择

单变量特征选择通过对每个特征进行单独的统计测试,来判断其与目标变量的相关性,然后选择相关性较高的特征。通过可视化掩码可以发现,大部分选定的特征是原始特征,并且大部分噪声特征被移除,但原始特征的恢复并不完美。

以下是比较逻辑回归在所有特征和仅选定特征上性能的代码:

from sklearn.linear_model import LogisticRegression

# transform test data:
X_test_selected = select.transform(X_test)
lr = LogisticRegression()
lr.fit(X_train, y_train)
print("Score with all features: %f" % lr.score(X_test, y_test))
lr.fit(X_train_selected, y_train)
print("Score with only selected features: %f" % lr.score(X_test_selected, y_test))

运行结果如下:
| 特征类型 | 得分 |
| ---- | ---- |
| 所有特征 | 0.929825 |
| 仅选定特征 |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值