15、算法评估与校准:保障算法公平性与有效性

算法评估与校准:保障算法公平性与有效性

1. 如何评估分数的排名顺序

在深入探讨算法校准之前,先来了解一下排名顺序评估,这有助于理解更高级的校准分析。

1.1 二元结果的排名评估指标

  • 基尼系数(Gini coefficient) :用于评估算法对二元结果的排名能力。
  • 柯尔莫哥洛夫 - 斯米尔诺夫统计量(Kolmogorov - Smirnov statistic,K - S 统计量) :与基尼系数类似,但不完全相同。二者都在 0 到 100 的范围内,不过对于同一算法,K - S 分数往往略低,有时会低 10 - 15 分。例如,基尼系数为 50 时,K - S 可能在 37 - 42 分的范围。
指标 特点
基尼系数 纳入了每个预测值,若算法在某些预测范围表现不佳,它会更严格
K - S 统计量 基本上衡量的是预测和结果分布中的一个单点(即算法“表现最佳”的点)

建议在评估算法时只使用其中一个指标,这样在对算法进行基准测试时才能进行公平比较。

1.2 连续结果的排名评估

对于连续结果(如头发数量),基尼系数和 K - S

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值