主成分分析在NHL球队得分预测中的应用
1. 主成分旋转示例
主成分旋转后,PC1和PC2上的新载荷如下:
| 变量 | PC1载荷 | PC2载荷 |
| ---- | ---- | ---- |
| 变量A | -0.5 | 0.02 |
| 变量D | 0.5 | -0.3 |
| 变量E | 0.15 | -0.75 |
虽然载荷发生了变化,但数据点并未改变。这个简单的示例虽未简化解释,但有助于理解主成分旋转过程。
2. 业务理解
本次分析聚焦于美国国家冰球联盟(NHL),旨在通过主成分分析(PCA)构建模型,预测球队总得分,为了解顶级职业球队的成功要素提供见解。
- 数据来源 :从www.nhl.com和www.puckalytics.com收集了30支NHL球队的统计数据,文件为nhlTrain.csv和nhlTest.csv,可从https://github.com/datameister66/data/获取。
- 赛季选择 :使用2015 - 16赛季数据训练模型,该赛季匹兹堡企鹅队夺冠,并在2017年2月15日的当前赛季结果上进行测试。
- 得分系统 :NHL采用积分制确定排名,每场比赛得分规则如下:
- 获胜方(常规时间、加时赛或加时赛后点球大战获胜)得2分。
- 常规时间输球方不得分。
- 加时赛或点球大战输球方得1分(所谓的败者分)。此规则自2005年开始实施,虽有争议,但未影响比赛的精彩程度。
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



