模型约束的实现与应用
1. 特征聚类与约束引入
从特征聚类的角度来看,当移除种族特征后,大部分交互会集中在 c_charge_degree 和 priors_per_year 所在的右下象限。限制一些不必要的交互有诸多好处,例如减少像 juv_fel_count 与 age_group 、 sex 与 length_of_stay 这类交互。接下来,我们将通过交互约束限制特征间的交互,并通过单调约束确保 priors_per_year 的单调性。
在实施约束前,需要先移除数据中的种族特征:
X_train_con = X_train.drop(['race'], axis=1).copy()
X_test_con = X_test.drop(['race'], axis=1).copy()
移除种族特征后,模型仍可能存在偏差,但特征工程和约束可以帮助调整模型。不过,这样做可能导致模型在测试数据上的性能下降,原因主要有两点:
- 信息丢失 :种族特征,尤其是与其他特征的交互,会影响结果,移除它意味着丢失了部分信息。
- 现实与理想的偏差 :实施约束的目的是让模型符合领域知识和理想标准,但这些标准可能在数据中并不明显,因为数据可能受到了制度性种族主义的影响。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



