因子旋转的理论基础

写本博客的目的是:在使用varimax方法时不知道原理到底是什么?查了好多教材和网上的资料,都没有具体的理论推导,无法真正理解此方法的内核计算。最后终于在factor analysis as a statistical method书中的chapter6找到相关内容,并进行整理,最后给出相关matlab代码。

1. varimax 方法

1.1 varimax的理论基础

在varimax旋转方法出现之前,通常使用旋转的图形方法,目的是消除负的因子载荷(loading)并且尽可能少的非0因子载荷来描述数据。但这种方法具有一定的主观性。

varimax方法与图形方法在某种程度上具有相似的特点。 与原始的因子载荷相比,用这种方法对因子进行旋转得到的新的因子载荷要么相对大要么相对小。正如我们所看到的,这种旋转的方法是通过最大化loading的平方的一个特定函数并且迭代完成的。在Kaiser’s的原始旋转方法中,因子是成对地旋转(两个两个的旋转)直到loadings收敛到最终值。下面我们描述的是"The simultaneously factor varimax solution"(同时因子varimax解),显然,这个方法的最主要特点是在每一次迭代时,所有因子同时被旋转,并非Kaiser’s的成对成对地旋转。它比原始的varimax方法更快,并且没有累积的舍入误差(因为原始方法是成对旋转的)。

将 矩阵 Λ 0 ( p × k ) \mathbf{\Lambda}_{0}(p \times k) Λ0(p×k) 看做是未旋转的因子载荷,则 Λ 0 ′ \mathbf{\Lambda}_{0}^{\prime} Λ0的第 i i i列(即 Λ 0 \mathbf{\Lambda}_{0} Λ0 的第 i i i行)是一个 k k k维的列向量,用 I i \mathbf{I}_{i} Ii表示。 定义 M \mathbf{M} M是一个 k × k k \times k k×k的正交旋转矩阵,它的第 r r rth列用 m r ( r = 1 , ⋯   , k ) \mathbf{m}_r(r=1,\cdots,k) mr(r=1,,k)。新的旋转的因子载荷矩阵 Λ = [ λ i r ] \mathbf{\Lambda}=\left[\lambda_{i r}\right] Λ=[λir],可以通过如下计算:
Λ = Λ 0 M \mathbf{\Lambda}=\mathbf{\Lambda}_{\mathbf{0}} \mathbf{M} Λ=Λ0M
因此,
λ i r = l i ′ m r . \lambda_{i r}=\mathbf{l}_{i}^{\prime} \mathbf{m}_{r} . λir=limr.

定义一个标量 d r ( r = 1 , ⋯   , k ) d_r(r=1,\cdots,k) dr(r=1,,k)

d r = ∑ i = 1 p λ i r 2 = ∑ i ( I i ′ m r ) 2 d_{r}=\sum_{i=1}^{p} \lambda_{i r}^{2}=\sum_{i}\left(\mathbf{I}_{i}^{\prime} \mathbf{m}_{r}\right)^{2} dr=i=1pλir2=i(Iimr)2

d r d_r dr表示的是 Λ \mathbf{\Lambda} Λ的第 r r rth列的因子载荷的平方和。

在同时varimax方法中的标准 x x x被最大化,形式如下:

x = ∑ r = 1 k [ ∑ i = 1 p ( λ i r 2 − d r / p ) 2 ] = ∑ r [ ∑ i λ i r 4 − d r 2 / p ] = ∑ r [ ∑ i ( I i ′ m r ) 4 − d r 2 / p ] \begin{aligned} x &=\sum_{r=1}^{k}\left[\sum_{i=1}^{p}\left(\lambda_{i r}^{2}-d_{r} / p\right)^{2}\right] \\ &=\sum_{r}\left[\sum_{i} \lambda_{i r}^{4}-d_{r}^{2} / p\right] \\ &=\sum_{r}\left[\sum_{i}\left(\mathbf{I}_{i}^{\prime} \mathbf{m}_{r}\right)^{4}-d_{r}^{2} / p\right] \end{aligned} x=r=1k[i=1p(λir2dr/p)2]=r[iλir4dr2/p]=r[i(Iimr)4dr2/p]
从这个定义中,我们可以看出: x x x代表的是 λ i r 2 \lambda_{i r}^{2} λir2与其对应的列均值的偏差平方和。这个 x x x的最大化与 M \mathbf{M} M有关。因为 M \mathbf{M} M是正交阵,所以它的列满足如下条件:

m r ′ m r = 1 , m r ′ m s = 0 ( r ≠ s ) \begin{aligned} \mathbf{m}_{r}^{\prime} \mathbf{m}_{r} &=1, & \\ \mathbf{m}_{r}^{\prime} \mathbf{m}_{s} &=0 &(r \neq s) \end{aligned} mrm

评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大浪淘沙_scc

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值