降维和特征选择的关键方法介绍及MATLAB实现

最新推荐文章于 2025-07-02 16:20:02 发布

原创

最新推荐文章于 2025-07-02 16:20:02 发布 · 3.4w 阅读

388 ·

CC 4.0 BY-SA版权

文章标签：

#降维 #特征选择 #PCA #PLS #正则化

本文介绍了降维和特征选择的概念，重点讲解了PCA和PLS方法，包括MATLAB的实现。PCA通过主成分分析提取特征，而PLS则综合考虑了主成分对输入和输出变量的解释能力。文中提供了MATLAB函数解读，包括princomp和plsregress，并通过光谱数据的PCR和PLS例子进行说明。特征选择方面讨论了Filter和Wrapper方法，以及正则化方法的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主成分分析（Principle Component Analysis, PCA）方法

偏最小二乘法(Partial Least Squares, PLS)

概念理解

降维：

比如现在有100维的变量来表征一个东西，我们觉得太冗余复杂了，想降低到10维。但是我们没有确定的筛选依据，直接使用数学工具来实现降维，就好像丢进了一个黑箱，经过抽象、提炼，得到了新的10维特征，这新的10维特征可能失去了物理意义，我们也不知道它们具体是怎么来的，表征什么，但是确实是可以用它们表征这个东西，而且是经过了原先100维特征的信息的融合、取舍过程。它的过程是比较高级的。

特征选择：

选择出100维特征里面最重要的10个特征，这个筛选过程是有依据的。比如苹果有很多特征，大小，形状，颜色，味道，生长季节，……。我们选择：颜色红、味道甜等几个非常明显的重要的特征出来就足以表示苹果了。当然，颜色和味道可能也有一定的耦合关系，生成地点、时间也有耦合关系，如果懒得管特征之间的耦合关系，直接丢进降维的黑箱中，也可以得到新的几个降维后的特征，但我们可能就说不出这个特征的含义了，只是一些数据信息而已了。