32、基于逻辑回归的群体层面学习方法实现更公平决策及不确定性量化研究

基于逻辑回归的群体层面学习方法实现更公平决策及不确定性量化研究

1. 实验背景与数据集

在机器学习领域,算法的公平性至关重要,尤其是在处理包含敏感属性(如性别、残疾状况、种族等)的数据时。为了研究如何通过群体层面的聚合算法训练来改变预测结果的公平性,我们使用了两个数据集进行实验,分别是成人收入数据集(Adult Income Dataset)和开放大学学习分析数据集(OULA Dataset)。

成人收入数据集包含种族敏感属性,我们将其分为非二进制属性(考虑五种不同种族)和二进制属性(将白人作为一类,其他四种少数族裔作为另一类)两种情况进行实验。OULA数据集包含性别和残疾状况等敏感属性,我们先单独考虑残疾属性(评估模型在不平衡二进制群体中的表现),然后考虑性别和残疾的多敏感属性组合(包含四种不同的人口群体)。

数据集采用70/30的比例划分训练集和测试集。虽然数据集中的类别分布相对平衡,但存在较大的群体分布不平衡,例如在OULA数据集中,残疾学生占数据样本的比例不到10%。

2. 实验设置

为了评估不同算法的公平性和预测准确性,我们设置了以下实验:
1. 基线模型 :使用Scikit - Learn构建经典的逻辑回归(LR)模型作为基线比较器,该模型不考虑公平性,仅以预测准确性为目标。
2. 公平性导向算法 :使用Fairlearn公平性工具包实现两种公平性导向的算法,分别是DP约束模型和EO约束模型。这两种模型通过Agarwal提出的降维技术,在训练过程中最大化公平性约束指标。
3. 群体层面的LR模型

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值