因子旋转的理论基础
写本博客的目的是:在使用varimax方法时不知道原理到底是什么?查了好多教材和网上的资料,都没有具体的理论推导,无法真正理解此方法的内核计算。最后终于在factor analysis as a statistical method书中的chapter6找到相关内容,并进行整理,最后给出相关matlab代码。
1. varimax 方法
1.1 varimax的理论基础
在varimax旋转方法出现之前,通常使用旋转的图形方法,目的是消除负的因子载荷(loading)并且尽可能少的非0因子载荷来描述数据。但这种方法具有一定的主观性。
varimax方法与图形方法在某种程度上具有相似的特点。 与原始的因子载荷相比,用这种方法对因子进行旋转得到的新的因子载荷要么相对大要么相对小。正如我们所看到的,这种旋转的方法是通过最大化loading的平方的一个特定函数并且迭代完成的。在Kaiser’s的原始旋转方法中,因子是成对地旋转(两个两个的旋转)直到loadings收敛到最终值。下面我们描述的是"The simultaneously factor varimax solution"(同时因子varimax解),显然,这个方法的最主要特点是在每一次迭代时,所有因子同时被旋转,并非Kaiser’s的成对成对地旋转。它比原始的varimax方法更快,并且没有累积的舍入误差(因为原始方法是成对旋转的)。
将 矩阵 Λ 0 ( p × k ) \mathbf{\Lambda}_{0}(p \times k) Λ0(p×k) 看做是未旋转的因子载荷,则 Λ 0 ′ \mathbf{\Lambda}_{0}^{\prime} Λ0′的第 i i i列(即 Λ 0 \mathbf{\Lambda}_{0} Λ0 的第 i i i行)是一个 k k k维的列向量,用 I i \mathbf{I}_{i} Ii表示。 定义 M \mathbf{M} M是一个 k × k k \times k k×k的正交旋转矩阵,它的第 r r rth列用 m r ( r = 1 , ⋯ , k ) \mathbf{m}_r(r=1,\cdots,k) mr(r=1,⋯,k)。新的旋转的因子载荷矩阵 Λ = [ λ i r ] \mathbf{\Lambda}=\left[\lambda_{i r}\right] Λ=[λir],可以通过如下计算:
Λ = Λ 0 M \mathbf{\Lambda}=\mathbf{\Lambda}_{\mathbf{0}} \mathbf{M} Λ=Λ0M
因此,
λ i r = l i ′ m r . \lambda_{i r}=\mathbf{l}_{i}^{\prime} \mathbf{m}_{r} . λir=li′mr.
定义一个标量 d r ( r = 1 , ⋯ , k ) d_r(r=1,\cdots,k) dr(r=1,⋯,k):
d r = ∑ i = 1 p λ i r 2 = ∑ i ( I i ′ m r ) 2 d_{r}=\sum_{i=1}^{p} \lambda_{i r}^{2}=\sum_{i}\left(\mathbf{I}_{i}^{\prime} \mathbf{m}_{r}\right)^{2} dr=i=1∑pλir2=i∑(Ii′mr)2
d r d_r dr表示的是 Λ \mathbf{\Lambda} Λ的第 r r rth列的因子载荷的平方和。
在同时varimax方法中的标准 x x x被最大化,形式如下:
x = ∑ r = 1 k [ ∑ i = 1 p ( λ i r 2 − d r / p ) 2 ] = ∑ r [ ∑ i λ i r 4 − d r 2 / p ] = ∑ r [ ∑ i ( I i ′ m r ) 4 − d r 2 / p ] \begin{aligned} x &=\sum_{r=1}^{k}\left[\sum_{i=1}^{p}\left(\lambda_{i r}^{2}-d_{r} / p\right)^{2}\right] \\ &=\sum_{r}\left[\sum_{i} \lambda_{i r}^{4}-d_{r}^{2} / p\right] \\ &=\sum_{r}\left[\sum_{i}\left(\mathbf{I}_{i}^{\prime} \mathbf{m}_{r}\right)^{4}-d_{r}^{2} / p\right] \end{aligned} x=r=1∑k[i=1∑p(λir2−dr/p)2]=r∑[i∑λir4−dr2/p]=r∑[i∑(Ii′mr)4−dr2/p]
从这个定义中,我们可以看出: x x x代表的是 λ i r 2 \lambda_{i r}^{2} λir2与其对应的列均值的偏差平方和。这个 x x x的最大化与 M \mathbf{M} M有关。因为 M \mathbf{M} M是正交阵,所以它的列满足如下条件:
m r ′ m r = 1 , m r ′ m s = 0 ( r ≠ s ) \begin{aligned} \mathbf{m}_{r}^{\prime} \mathbf{m}_{r} &=1, & \\ \mathbf{m}_{r}^{\prime} \mathbf{m}_{s} &=0 &(r \neq s) \end{aligned} mr′m

最低0.47元/天 解锁文章
397

被折叠的 条评论
为什么被折叠?



