用线性模型预测投票结果
1. 线性关系分析
在进行线性回归分析时,我们首先观察变量之间的线性关系。通过散点图可以发现,18 - 44岁人群的比例( Age_18to44 )与支持脱欧人群的比例( Proportion )呈现明显的线性关系,即随着18 - 44岁人群比例的增加,支持脱欧人群的比例下降。同时,选区中学生的比例( Students )与 Proportion 在初始区间( Students 介于0 - 20之间)也呈现明显的线性关系,之后虽仍似线性关系,但受到高比例学生观测值的干扰。不过,我们仍可假设 Students 与 Proportion 之间存在线性关系。
在进行多元线性回归时,需要对其余变量的线性假设进行检验。虽然这里为节省篇幅省略了,但建议大家自行检验。要知道,很难让所有变量都呈现完全的线性关系,这种线性假设主要是为了衡量变量在回归中的预测能力。只要变量间呈现出轻微的线性关系,就可以进行后续分析。
2. 正态性检验
我们使用两种不同的技术来检验数据的正态性,以此展示策略模式的应用。策略模式是一种可以复用代码、避免代码重复的技术,它通过改变具体的实现策略来完成不同的任务。
以下是相关代码实现:
save_png <- function(data, variable, save_to, function_to_create_image
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



