43、模型约束的实现与应用-优快云博客

本文链接：https://blog.youkuaiyun.com/d3e4f/article/details/152286140

模型约束的实现与应用

1. 特征聚类与约束引入

从特征聚类的角度来看，当移除种族特征后，大部分交互会集中在 c_charge_degree 和 priors_per_year 所在的右下象限。限制一些不必要的交互有诸多好处，例如减少像 juv_fel_count 与 age_group 、 sex 与 length_of_stay 这类交互。接下来，我们将通过交互约束限制特征间的交互，并通过单调约束确保 priors_per_year 的单调性。

在实施约束前，需要先移除数据中的种族特征：

X_train_con = X_train.drop(['race'], axis=1).copy()
X_test_con = X_test.drop(['race'], axis=1).copy()

移除种族特征后，模型仍可能存在偏差，但特征工程和约束可以帮助调整模型。不过，这样做可能导致模型在测试数据上的性能下降，原因主要有两点：
- 信息丢失 ：种族特征，尤其是与其他特征的交互，会影响结果，移除它意味着丢失了部分信息。
- 现实与理想的偏差 ：实施约束的目的是让模型符合领域知识和理想标准，但这些标准可能在数据中并不明显，因为数据可能受到了制度性种族主义的影响。