降维的直接方法与应用
1. 土耳其教师评价数据的主成分分析(PCA)
在处理土耳其学生对教师的评价数据时,我们可以使用主成分分析(PCA)来进行降维。该数据集包含了学生的相关问题以及对教师28个不同方面的评分,学生对每个问题的评分为1到5分。
我们可能对将衡量学生对教师热情的问题9与其他变量(包括难度变量)进行回归感兴趣。为了简化分析,我们尝试将28个评分变量减少到几个。以下是具体的R代码操作:
turk <- read.csv('turkiye-student-evaluation-generic.csv')
tpca <- prcomp(turk[, -(1:2)])
summary(tpca)
运行上述代码后,我们可以得到各主成分的重要性信息,如下表所示:
| 主成分 | 标准差 | 方差比例 | 累积方差比例 |
| — | — | — | — |
| PC1 | 6.1372 | 0.7535 | 0.7535 |
| PC2 | 1.70133 | 0.05791 | 0.81143 |
| PC3 | 1.40887 | 0.03971 | 0.85114 |
| PC4 | 1.05886 | 0.02243 | 0.87357 |
| PC5 | 0.81337 | 0.01323 | 0.88681 |
| PC6 | 0.75777 | 0.01149 | 0.89830 |
从结果中可以看出,第一个主成分已经包含了约75%的总数据变化,这是相当显著的,因为数
超级会员免费看
订阅专栏 解锁全文
1799

被折叠的 条评论
为什么被折叠?



