为什么要进行特征选择和数据降维?
“特征选择是选择用于模型构建的相关特征的子集的过程”,或者换句话说,选择最重要的特征。
降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。但降维之后的数据不可解释了,改变了原来的维度所在的意义,产生了新的维度。

一、特征选择的三种方式?

1.过滤选择



二、降维
1.PCA---方差越大,数据反应的信息就越多




特征选择和数据降维是数据分析中的关键步骤。特征选择通过筛选出最重要特征,减少噪声并提高模型效率。降维则通过保留主要信息,去除冗余特征,帮助应对高维数据的挑战,尽管可能牺牲部分可解释性。PCA作为常见的降维方法,依据方差大小来决定特征的重要性。这两个过程在机器学习中发挥着重要作用,平衡模型的性能与理解性。
“特征选择是选择用于模型构建的相关特征的子集的过程”,或者换句话说,选择最重要的特征。
降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。但降维之后的数据不可解释了,改变了原来的维度所在的意义,产生了新的维度。










被折叠的 条评论
为什么被折叠?