pandas中dropna()参数详解

本文详细介绍了pandas中dropna()函数的使用,包括如何通过axis参数选择删除行或列,how参数设置全为NA或任意NA时的删除策略,thresh参数指定保留最少非NA值的数量,以及subset参数指定检查缺失值的特定列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pandas中dropna()参数详解

DataFrame.dropna( axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

1.axis参数确定是否删除包含缺失值的行或列

axis=0或axis='index’删除含有缺失值的行,

axis=1或axis='columns’删除含有缺失值的列,

import pandas as pd
import numpy as np
df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),
                            pd.NaT]})
df
nametoyborn
0AlfredNaNNaT
1BatmanBatmobile1940-04-25
2CatwomanBullwhipNaT
df.dropna()

#默认是axis=0
nametoyborn
1BatmanBatmobile1940-04-25
df.dropna(axis=1)
#输出
name
0Alfred
1Batman
2Catwoman
2.how参数当我们至少有一个NA时,确定是否从DataFrame中删除行或列

how='all’或者how=‘any’。

how='all’时表示删除全是缺失值的行(列)

how='any’时表示删除只要含有缺失值的行(列)

df.dropna(how='all')
nametoyborn
0AlfredNaNNaT
1BatmanBatmobile1940-04-25
2CatwomanBullwhipNaT
3.thresh=n表示保留至少含有n个非na数值的行
df.dropna(thresh=2)
nametoyborn
1BatmanBatmobile1940-04-25
2CatwomanBullwhipNaT
4.subset定义要在哪些列中查找缺失值
df.dropna(subset=['name', 'born'])

#删除在'name' 'born'列含有缺失值的行
nametoyborn
1BatmanBatmobile1940-04-25

5.inplace表示直接在原DataFrame修改

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值