[Sklearn应用] Preprocessing data (四)missing values 缺失值处理

在数据预处理中,缺失值处理是重要一环。直接删除会影响数据完整性,而合理填充能保持数据原有结构。通常不建议用平均值填充,而是采用特定值如"-999"或"-1"。但使用"-1"时需谨慎,因为标准化可能产生相似数值。此外,无穷大和无穷小值应转换为NaN后再处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/preprocessing.html#
sklearn版本:0.18.2

缺失值不能直接删除。缺失值有其存在原因,删除后不仅使可用的数据变少,也会使原本的数据发生改变,影响结果准确性。

from sklearn.preprocessing import Imputer
im = Imputer()          # 默认参数 missing_values="NaN",strategy="mean"
						# strategy还可用"median"、"most_frequent"
im.fit(X)         
im.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值