斯坦福大学机器学习——特征选择（Feature selection）

最新推荐文章于 2025-07-13 19:31:36 发布

linkin1005

最新推荐文章于 2025-07-13 19:31:36 发布

阅读量2.3w

点赞数 11

CC 4.0 BY-SA版权

分类专栏：数据挖掘机器学习文章标签：数据挖掘机器学习特征选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/linkin1005/article/details/43018827

特征选择是一种及其重要的数据预处理方法。假设你需要处理一个监督学习问题，样本的特征数非常大（甚至 $n\gg m$ ），但是可能仅仅有少部分特征会和对结果产生影响。甚至是简单的线性分类，如果样本特征数超过了n，但假设函数的VC维确仍然是O(n)，那么，除非大大扩展训练集的数量，否则即会带来过拟合的问题。在这样的情况下，可以使用特征选择算法降低特征的数量。

假设样本有n个特征，那么，其有 $2^n-1$ 种可能的特征子集，如果特征选择需要去穷举所有 $2^n$ 种可能的特征子集，对于n比较大的情况，计算的代价太大，无法真正实现。因此可以通过一些启发式算法实现特征的选择。

正向搜索/反向搜索（

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。