特征选择包括: 1.Filter 使用方差、Pearson相关系数、互信息等方法过滤特征,评估单个特征和结果值之间的相关程度,留下Top相关的特征部分。 2.Wrapper 可利用“递归特征删除算法”,把特征选择看做一个特征子集搜索问题,筛选各种特征子集,用模型评估效果。 3.Embedded 可利用正则化方式选择特征,使用带惩罚项的基模型,除了选择出特征外,同时也进行了降纬。 意义: -剔除对结果预测不大的特征,减小冗余,选择有意义的特征输入模型,提高计算性能。 降纬: 方法:主成分分析法(PCA)和线性判别分析(LDA) 意义: 通过PCA或LDA方法,将较高纬度样本空间映射到较低维度的样本空间,从而达到降纬的目的,减少模型的训练时间,提高模型的计算性能。
特征选择
最新推荐文章于 2024-03-27 13:16:23 发布