Sklearn 机器学习 缺失值处理 获取填充失值的统计值

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在优快云上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

使用 Scikit-learn 处理缺失值并提取填充统计信息的完整指南

在机器学习项目中,数据清洗是不可或缺的步骤,而处理缺失值更是其中的重点之一。Scikit-learn 作为一个强大的机器学习库,不仅提供了便捷的缺失值填充方法,还允许我们提取关键的填充统计信息,用于分析、可视化或模型解释。

本文将详细介绍几种常见的缺失值填充方法,并说明如何在填充过程中获取有价值的统计信息。


📌 示例数据

我们使用一个包含缺失值的简单二维数组作为示例数据:

import numpy as np

X = np.array([
    [1, 2, np.nan],
    [3, np.nan, 4],
    [5, 6, np.nan]
])

方法一:使用 SimpleImputer 获取填充统计值

SimpleImputer 是 Scikit-learn 提供的基础填充工具,支持多种策略:mean(均值)、median(中位数)、most_frequent(众数)、constant(常数)。

from sklearn.impute import SimpleIm
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Thomas Kant

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值