因子分析(Factor Analyse)推导以及R语言实现

因子分析是一种用于降维的统计方法,它假设数据受少数公共因子影响。本文介绍了因子模型的理论,包括准备工作、PCA估计和因子旋转。通过R语言的`psych`和`principal`库,展示了如何估计因子载荷矩阵并进行因子旋转,以提高模型解释力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

因子模型

对于降维算法里,大家熟知的是SVD和PCA,甚至是t-sne。但在统计解释上来说,降维算法找到了相应的低维子空间,但解释力不足,比如PCA,对于降维后数据的解释力降低。因此对于小规模数据集,在变量众多的情况下,因子模型是较好的处理多变量的方法。通过PCA降维估计,再进行因子旋转,使得因子模型在降维的同时具备了较好的解释力。

准备工作

因子模型假设中心化的X线性依赖于一些未观测到的随机变量F1,...,FmF1,...,Fm和误差,称F1,...,FmF1,...,Fm为公共因子,因子模型可表示为以下一式:

Xμ=LF+εX−μ=LF+ε

其中 L=(lij)p×mL=(lij)p×m 为因子载荷矩阵, lijlij 为第i个变量在第j个因子上的载荷(描述了第i个变量和第j个因子的相关性), Fm×1Fm×1 称为公共因子, εp×1εp×1 称为特殊因子。
因子模型假设:
1. E(F)=0,Cov(F)=ImE(F)=0,Cov(F)=Im
2. E(ϵ)=0,Cov(ϵ)=φp×p=diag(φ1...φp)E(ϵ)=0,Cov(ϵ)=φp×p=diag(φ1...φp)
3. Cov(ε,F)=0Cov(ε,F)=0
4. Cov(X)=Σp×m=LL+φ,Cov(X,F)=Lp×mCov(X)=Σp×m=LL′+φ,Cov(X,F)=Lp×m

其中第四条假设为因子模型的核心,则对于i=1,…,p,令l(i)l(i)为L的第i行,则有:

{
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值