前言:这是学校多元统计分析课程布置的实验(包括基于python的线性代数运算、线性回归分析实验、聚类分析、因子分析和主成分分析),这里分享出来,注解标注的比较全,供大家参考。
1、文件“test4-1.csv”给出的是52名学生的数学(x1)、物理(x2)、化学(x3)、语文(x4)、历史(x5)和英语(x6)成绩。使用数据完成以下内容。
①使用SPSS的因子分析功能对数据进行因子分析;







②使用python语言编程实现因子分析的功能,并运行上述数据,输出结果:因子载荷和因子得分,与SPSS因子分析结果进行比较。
import numpy as np
import pandas as pd
from sklearn.decomposition import PCA, FactorAnalysis
from sklearn import preprocessing
from factor_analyzer import FactorAnalyzer
# 取消科学计数法
np.set_printoptions(suppress=True)
df = pd.read_csv("test4-1.csv")
columns = df.shape[1]
data = df.columns[1: columns]
df = np.array(df[data])
# 皮尔森相关系数
df_corr = np.corrcoef(df)
# 数据标准化
df_z = preprocessing.scale(df

最低0.47元/天 解锁文章
1万+





