HistGradientBoostingClassifier 原生支持缺失值。

最新推荐文章于 2024-09-06 13:55:57 发布

dataschool

最新推荐文章于 2024-09-06 13:55:57 发布

阅读量540

点赞数 5

文章标签： scikit-learn python 机器学习

本文链接：https://blog.youkuaiyun.com/dataschool/article/details/141270347

版权

本文以一个示例展示了如何使用HIST Gradient Boosting Classifier 处理缺失值。该模型是Scikit-learn 中唯一一个原生支持缺失值的分类模型，它可以处理缺失值，而无需进行任何填充操作。

示例步骤：

使用Pandas 统计训练数据和测试数据中每个特征的NaN数量。
将训练数据中的目标变量（Survived）分离出来，并将训练数据缩减为三个特征。
使用HIST Gradient Boosting Classifier 进行训练和预测。

结果：

该模型成功地对测试数据进行了预测，并且没有出现任何错误。这是因为该模型可以原生处理缺失值，而无需进行填充或删除操作。

总结：

使用原生支持NaN的模型是处理缺失值的最佳选择，因为它可以避免数据丢失和偏差，并提供更准确的结果。本文介绍的HIST Gradient Boosting Classifier 就是一个很好的例子，它可以有效地处理缺失值，并提供强大的预测能力。 " 88HdqNDQsEk,video_aigc_402790,Haar 级联目标检测面部和眼睛 - OpenCV Python 图像和视频分析 16,在本篇 OpenCV 与 Python 教程中，我们将讨论使用 Haar Cascades 进行目标检测。我们将从人脸和眼睛检测开始。为了使用级联文件进行目标识别/检测，您首先需要级联文件。对于一些非常流行的任务，这些文件已经存在。例如，检测人脸、汽车、微笑、眼睛和车牌等都是非常普遍的。首先，我将向您展示如何使用这些级联文

处理缺失值（NaN）的四种选择：1. 删除包含 NaN 的行2. 删除包含 NaN 的列3. 用插补值填充 NaN4. 使用原生处理 NaN 的模型（新！）注意：从 scikit-learn 1.0 开始，HistGradientBoostingClassifier 和 HistGradientBoostingRegressor 将被视为稳定（而不是实验性），因此您不再需要显式启用它们。