【十】特征选择

最新推荐文章于 2025-05-19 18:43:09 发布

禛zhen

最新推荐文章于 2025-05-19 18:43:09 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏：斯坦福大学公开课机器学习课程文章标签：机器学习教程

本文链接：https://blog.youkuaiyun.com/knight_wzz/article/details/52933498

本文探讨了无限假设集问题，指出训练样本数与假设集的VC维成正比。接着介绍了交叉验证法，如简单交叉验证和k折交叉验证，用于模型选择和避免过拟合。最后，讨论了特征选择的重要性，提到了前向搜索、反向搜索和过滤特征选择等方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

无限假设集问题 The Case of Infinite H

在上一讲中我们讲解了有限假设集的情况，在这一讲中我们将把它扩展到无限假设集的情况上。

我们先思考一种直观的思路。假设我们有一个无限假设集，它被d个参数描述。当我们将其存在计算机中时，如果以双精度浮点格式存储，则存储一个数需要64 bit的空间，所以存储假设集中的一种假设就需要64d bit这么大的空间。由于计算机中一位只表示0和1，因此我们的“无限”假设集最多包含k=2^(64d)个假设。之所以由无限变为了有限，是因为计算机在存储过程中采用了一定的近似，相当于将连续值离散化了，并且表示的数的范围也是有限的。但我们提出这种思路只是为了更好的理解无限假设集如何将上一讲中得出的结论应用下来。将K带入上一讲最后的公式中，在保证准确率高于1-δ的情况下，我们有