数据集偏差
计算数据集的偏差。
输入
- 数据:待评估的数据集
数据集偏差 计算并显示数据集的偏差。具体而言,它会计算数据集的“差异影响”和“统计奇偶差异”指标。
理想阈值对于“差异影响”为1.0,对于“统计奇偶差异”为0.0。低于理想阈值表示偏向非特权群体,高于理想阈值表示偏向特权群体。

示例
本示例展示了数据集偏差小部件的简单用法。首先加载一个公平性数据集(本例为Adult数据集),然后将数据集连接到数据集偏差小部件。小部件会显示数据集的“差异影响”和“统计奇偶差异”指标。

注意,在使用数据集偏差小部件之前,我们并未使用作为公平性数据小部件。这是因为Adult数据集已包含所需的公平性元属性。
另外需要注意的是,数据集偏差小部件(及其他公平性小部件)不支持缺失值,这一点通过小部件上方的警告图标标明。数据集中的任何缺失值在用于小部件之前会自动用平均值或众数填充。

被折叠的 条评论
为什么被折叠?



