同方差性及相关问题的实践探讨
1. 年龄与性别对评分的影响
在相关研究中,年龄和性别对评分行为存在一定影响。年龄方面,年龄越大的人发布的评分越少,每增加 10 岁,发布的评分大约减少 8 个。不过,与平均发布评分数量(约 106.0445 个)相比,这只是一个适度的下降。而性别方面,女性平均比男性少评 16.8 部电影,这一差异较为显著。
2. 同方差假设的问题
2.1 以身高和体重为例
以棒球运动员的数据为例,我们直观地认为高个子的人体重的变化比矮个子的人更大。通过以下代码计算不同身高组的体重样本标准差:
library(freqparcoord)
data(mlb)
m70 <- mlb[mlb$Height >= 70 & mlb$Height <= 77, ]
sds <- tapply(m70$Weight, m70$Height, sd)
plot(70:77, sds)
结果呈现出明显的上升趋势,这表明同方差假设并不合理。普通最小二乘法(OLS)对 $\beta$ 的统计推断基于同方差假设,但在实际中,该假设很少成立。
2.2 相关问题的提出
由于同方差假设难以成立,我们需要考虑以下几个问题:
- 同方差假设的偏离是否会显著影响基于 OLS 统计推断程序的有效性?
- 能否估计函数 $\sigma^2(t)$ 并用于加权最小二乘法(WLS)分析?
- 能否针对异方差情况修改 OLS 的协方差公式?
超级会员免费看
订阅专栏 解锁全文
1006

被折叠的 条评论
为什么被折叠?



