1 综述
(1) 什么是特征选择
特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。
(2) 为什么要做特征选择
在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致如下的后果:
Ø 特征个数越多,分析特征、训练模型所需的时间就越长。
Ø 特征个数越多,容易引起“维度灾难”,模型也会越复杂,其推广能力会下降。
特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化了模型,使研究人员易于理解数据产生的过程。
本文详细介绍了特征选择的重要性和过程,包括产生过程、评价函数、停止准则和验证过程。特征选择旨在减少不相关或冗余特征,提高模型效率。文中列举了各种搜索算法,如完全搜索、启发式搜索、随机搜索,并详细讨论了相关性、距离、信息增益等评价函数。特征选择对于避免维度灾难和提升模型准确性至关重要。
订阅专栏 解锁全文
533

被折叠的 条评论
为什么被折叠?



