模型公平性与偏差缓解:成人收入预测案例分析
1. 成人收入预测问题引入
在实际应用中,预测成人收入是一个具有重要意义的问题,例如在资源分配、政策制定等方面都有广泛应用。这里以预测美国成年人收入为例,该问题可被定义为一个二分类问题,即判断成年人年收入是否超过 5 万美元。
1.1 数据集概述
我们使用了一个包含 30,940 名成年人信息的历史数据集,输入特征如下表所示:
| Feature name | Description | Type | Is protected attribute? |
| — | — | — | — |
| age | Age of the adult | Continuous | Yes |
| workclass | Class of worker | Categorical | No |
| fnlwgt | Final weight assigned by the Census Bureau | Continuous | No |
| education | Level of education | Categorical | No |
| marital - status | Marital status | Categorical | No |
| occupation | Occupation | Categorical | No |
| gender | Male or female | Categorical | Yes |
| race | White or Black | Categorical | Yes |
| c
超级会员免费看
订阅专栏 解锁全文
920

被折叠的 条评论
为什么被折叠?



