因子分析是基于降维的思想,在尽可能不损失或者少损失原始数据信息的情况下,将错综复杂的众多变量聚合成少数几个独立的公共因子,这几个公共因子可以反映原来众多变量的主要信息,在减少变量个数的同时,又反映了变量之间的内在联系。通常因子分析有三种作用:一是用于因子降维,二是计算因子权重,三是计算加权计算因子汇总综合得分。
一、因子分析步骤
应用因子分析法的主要步骤如下:
-
对所给的数据样本进行标准化处理
-
计算样本的相关矩阵R
-
求相关矩阵R的特征值、特征向量
-
根据系统要求的累积贡献度确定主因子的个数
-
计算因子载荷矩阵A
-
最终确定因子模型
利用Python进行因子分析的核心库是:factor_analyzer
二:实例讲解
#1.导入库
# 数据处理
import pandas as pd
import numpy as np
# 绘图
import seaborn as sns
import matplotlib.pyplot as plt
# 因子分析
from factor_analyzer import FactorAnalyzer
#df = pd.read_c