游戏评分算法与围棋模式频率分布研究
1. 游戏评分算法性能对比
在游戏领域,准确评估玩家的实力是一项重要任务。多种评分算法被用于此目的,下面是一些常见评分算法的预测性能对比:
| 算法 | 时间(训练集) | 训练集预测率 | 测试集预测率 | 最优参数 |
| — | — | — | — | — |
| Elo | 0.41 s | 56.001% | 55.121% | k = 20 |
| Glicko | 0.73 s | 56.184% | 55.522% | σ0 = 150 Elo, w2 = 20 Elo²/day |
| TrueSkill | 0.40 s | 56.212% | 55.536% | β² = 1, σ²₀ = 0.5, w² = 0.000975/game |
| Bayeselo | 88.66 s | 56.216% | 55.671% | prior = 1 |
| Decayed history | 89.86 s | 56.260% | 55.698% | prior = 1, τ = 400 days |
| WHR | 252.00 s | 56.356% | 55.793% | prior = 1.2, w² = 14 Elo²/day |
从这些数据可以看出,WHR算法在预测性能上显著优于其他算法。同时,能够记住所有游戏结果的算法表现优于快速增量方法。不过,测试集的性能普遍低于训练集,这可能不仅仅是过拟合的原因,还可能是由于训练集和测试集对应的时间周期不同,游戏的统计特性存在差异。例如,KGS评分系统可能有所改进,服务器自动平衡比赛使得近期游戏更加均衡,从而更难预测
超级会员免费看
订阅专栏 解锁全文
7916

被折叠的 条评论
为什么被折叠?



