体育数据分析:泊松回归与网页数据抓取
1. 体育博彩概率分析
在体育博彩中,对运动员表现的概率估计至关重要。以帕特里克·马霍姆斯(Patrick Mahomes)为例,我们估计他抛出三次或更多达阵传球的概率为 35.2%,而进行“大”投注所需的概率为 40%,因此目前该投注没有价值。他抛出两次或更少达阵传球的概率为 64.8%,略低于“小”投注所需的 64.9%,同样不建议投注。另一家博彩公司 FanDuel 的指数为 1.5 次达阵,“大”投注赔率为 –205(盈亏平衡概率 67.2%),“小”投注赔率为 +164(盈亏平衡概率 37.9%),但我们计算出一次或更少达阵传球的可能性为 37.8%,两次或更多为 62.2%,“小”投注概率略低于盈亏平衡概率,依然没有投注价值。幸运的是,马霍姆斯在比赛中超过了 1.5 和 2.5 次达阵传球,最终获得了 MVP。总体而言,除少数情况外,不建议进行投注。
2. 泊松回归系数
2.1 泊松回归原理
广义线性模型(GLM)的系数依赖于链接函数,与逻辑回归类似。在 Python 和 R 中,泊松回归默认需要应用指数函数使系数与数据处于同一尺度。这会使链接尺度上的系数从加法性(如线性回归系数)变为乘法性(如逻辑回归系数)。
2.2 模拟演示
为了更好地理解泊松回归,我们进行模拟。从均值为 1 的泊松分布中抽取 10 个样本并保存为对象 x,然后查看 x 的值和均值。
Python 代码实现
from scipy.stats import poisson
x = poi
泊松回归与网页抓取在体育分析中的应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



