【pandas、numpy】缺失值填充和重复值处理练习

本文介绍了如何使用Pandas库在Python中处理数据集,包括用不同方法填充缺失值(如用常数、前向填充、后向填充、特定值填充)以及如何检测和删除重复数据。这些技巧对于数据预处理至关重要,确保数据分析的准确性和可靠性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import numpy as np
import pandas as pd

df = pd.DataFrame([[np.nan, 2, np.nan, 0]
                 ,[3, 4, np.nan, 1]
                 ,[np.nan, np.nan, np.nan, 4]
                 ,[np.nan, 3, np.nan, 4]]
                 , columns = list('ABCD'))
df
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 4
3 NaN 3.0 NaN 4
df.fillna(33)
A B C D
0 33.0 2.0 33.0 0
1 3.0 4.0 33.0 1
2 33.0 33.0 33.0 4
3 33.0 3.0 33.0 4
df
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 4
3 NaN 3.0 NaN 4
# 向前填充
df.fillna(method='ffill')
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 3.0 4.0 NaN 4
3 3.0 3.0 NaN 4
df
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 4
3 NaN 3.0 NaN 4
# 按照指定值进行填充
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值