使用pandas清洗完数据时,需要重建索引,否则访问时会报KeyError!!

问题:

当我们对Dataframe对象进行数据清洗之后, 例如去掉含NaN的行之后, 发现行索引还是原来的行索引

    datatmsp = datatmsp[~datatmsp['brand'].isin(['None'])]

    # 删除重复数据
    datatmsp = datatmsp.drop_duplicates()

    # 删除缺失值的列   重建索引!!!
    datatmsp = datatmsp.dropna().reset_index(drop=True)

    return analyse_data(datatmsp)

例如进过上述操作,假使会 删除掉索引为5的数据,这时候如果后面通过索引访问为5的对象,就会报KeyError错误,之前一直不清楚原因,调试了半天才发现必须重建索引!

关键代码:

    # 删除缺失值的列   重建索引!!!
    datatmsp = datatmsp.dropna().reset_index(drop=True)

之后就可以正常遍历元素了!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值