博客摘录「 12 机器学习 数据探索性分析 机器学习项目实战」2024年9月2日

for x in data.columns: # 过滤掉类型为object的列 if str(data[x].dtypes) == 'object': continue if data[x].isnull().sum() > 0: # 获取非空元素的中位数 data[x] = data[x].fillna(value=np.median(data.loc[~data[x].isnull(), x]))

分步解释

  1. data[x].isnull():

    • data[x].isnull() 返回一个布尔序列(Series),标记 data[x] 列中哪些值是缺失值(NaN)。
  2. ~data[x].isnull():

    • ~ 是取反操作符,将布尔序列中的 True 转为 FalseFalse 转为 True。这会标记哪些值不是缺失值(即存在值的地方为 True)。
  3. data.loc[~data[x].isnull(), x]:

    • data.loc[...] 用于选择数据框 data 中的行和列。data.loc[~data[x].isnull(), x] 会选择 data[x] 列中所有非缺失值的行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值