利用描述性统计理解投票行为
1. 相关性分析
相关性是衡量两个变量之间线性关系的指标,其值范围从 -1(完全负相关)到 1(完全正相关)。我们可以创建相关性矩阵图,其中大圆圈表示高绝对相关性,蓝色圆圈表示正相关,红色圆圈表示负相关。
以下是创建相关性矩阵图的代码:
library(corrplot)
corrplot(corr = cor(data_numerical), tl.col = "black", tl.cex = 0.8)
通过观察 Proportion 变量与其他变量的关系,大蓝色圆圈表示正相关,即该变量增加时, Proportion 变量也更可能增加;大红色圆圈表示负相关,即该变量增加时, Proportion 变量更可能减少。
2. 创建新数据集
根据之前的分析,年龄、教育和种族是理解人们在脱欧公投中投票方式的重要因素。年轻且教育程度高的人倾向于投票支持留在欧盟,年长的白人则倾向于投票支持离开欧盟。
我们可以创建一个更简洁的数据集,步骤如下:
1. 添加相关变量 :
- 年龄分为两组:45 岁以下和 45 岁以上。
- 种族分为两组:白人和非白人。
- 教育分为两组:高教育水平和低教育水平。
data$Age_18to44 <- data$Age_18to24 + da
超级会员免费看
订阅专栏 解锁全文
1312

被折叠的 条评论
为什么被折叠?



