实证建模:从线性到曲线模型的探索
1. 《X 档案》观众数量建模
1.1 数据准备
以《X 档案》前两季的观众数量数据为例,我们要构建一个实证模型来预测每周的观众数量。这里,观众数量是因变量,时间作为自变量,为了满足回归分析中变量尺度能用实数合理表示的要求,我们用剧集播出的周数而非集数来衡量时间。例如,1993 年 9 月 10 日播出的第一集标记为第 1 周,1993 年 9 月 17 日播出的第二集标记为第 2 周,第六集因在第 7 周播出,其第一个坐标就是 7,第 23 周有两集新剧播出,所以有两个 23。这些数据以有序对的形式呈现,如下表所示:
| Season 1 | Season 2 | Season 1 | Season 2 |
| — | — | — | — |
| 9.8 | 6.2 | 7.4 | 6.9 |
| 9.3 | 6.8 | 10.2 | 6.8 |
| 8.7 | 7.2 | 10.8 | 5.9 |
| 8.2 | 6.8 | 9.8 | 6.2 |
| 8.5 | 5.8 | 10.7 | 9.6 |
| 5.6 | 9.2 | 7.1 | 5.6 |
| 9 | 7.2 | 10.2 | 6.2 |
| 9.1 | 7.5 | 9.8 | 6.1 |
| 8.6 | 7.9 | 5.1 | 9.9 |
| 7.7 | 8.5 | 6.4 | 8.5 |
| 8.1 | 6.4 | 8.3 | 9 |
| 9.7 | 9.6 | | |
将这些数据绘制成散点图,发现呈现出线性趋势,表明线性模型可能较为
超级会员免费看
订阅专栏 解锁全文
1041

被折叠的 条评论
为什么被折叠?



