使用Pandas的dropna函数删除DataFrame中全是缺失值的数据列

最新推荐文章于 2025-04-16 14:17:39 发布

DarcyCode

最新推荐文章于 2025-04-16 14:17:39 发布

阅读量392

点赞数

CC 4.0 BY-SA版权

文章标签： pandas Python

本文链接：https://blog.youkuaiyun.com/DarcyCode/article/details/132728933

Python 专栏收录该内容

244 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了如何使用Pandas的dropna函数删除DataFrame中全是缺失值的数据列。通过示例，详细讲解了dropna的参数设置，包括axis=1表示按列删除，thresh参数指定至少非空值的数量，以及inplace参数用于直接在原数据框上操作。

使用Pandas的dropna函数删除DataFrame中全是缺失值的数据列

在数据处理和分析中，经常会遇到处理缺失值的情况。Pandas是一个强大的数据处理库，提供了许多函数和方法来处理缺失值。其中，dropna函数可以用于删除包含全是缺失值的数据列。

首先，我们需要导入Pandas库，并创建一个包含缺失值的DataFrame作为示例：

import pandas as pd
import numpy as np

# 创建包含缺失值的DataFrame
data = {
   
   'A': [1, 2

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

DarcyCode

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

使用pandas的dropna函数删除dataframe中全是缺失值的列

带你成为别人眼中的大佬！

04-24

673

本文介绍了如何使用pandas的dropna函数删除dataframe中全是缺失值的列。除此之外，我们还可以使用isnull和any函数实现相同的功能。在实际应用中，我们可以根据数据情况选择适合自己的方法。在数据处理中，经常会出现某些列全部为空的情况，这时我们需要使用dropna函数将这些列删除，以便更好地进行数据分析和处理。其中，axis=1表示按列进行操作，how='all’表示只删除全是缺失值的列。使用pandas的dropna函数删除dataframe中全是缺失值的列。

pandas使用dropna函数删除dataframe中全是缺失值的数据列（drop columns with all missing values in dataframe）

data+scenario+science+insight

04-02

958

pandas使用dropna函数删除dataframe中全是缺失值的数据列（dropcolumns with all missing values in dataframe）

参与评论您还未登录，请先登录后发表或查看评论

Pandas实战：使用dropna函数轻松删除DataFrame中所有含有缺失值的数据行

HackSquad的博客

08-16

402

how参数表示删除方式，'any’表示只要该行数据中存在缺失值就进行删除，'all’表示该行所有数据都为缺失值才进行删除。在实际操作中，我们经常会遇到需要删除DataFrame中含有缺失值的数据行的情况，这时候可以使用Pandas中的dropna函数。通过上面的例子，我们可以发现使用Pandas中的dropna函数非常简单方便，能够快速有效地删除DataFrame中含有缺失值的数据行，大大提高数据清洗和数据分析的效率。可以看到，最终我们成功地将含有缺失值的行都删除了，只剩下一行完整的数据。

李沐课程，pandas删除缺失值最多的列。

2301_76381099的博客

02-26

1329

删除缺失值最多的列。

使用pandas删除dataframe中缺失值的列

qq_37934722的博客

04-24

664

在pandas中，我们可以使用dropna函数来删除dataframe中的缺失值。如果我们想要删除所有数据均为缺失值的列，我们可以使用how='all’参数来指定。这里我们需要用到drop函数和count函数进行操作。这里我们使用了drop函数和index.values方法来删除列，同时通过axis=1来指明我们想要删除列而不是行。该示例dataframe中包含3个列A、B和C，其中A、B列有缺失值。可以看到，只剩下了包含非缺失值数量大于等于2的列C。使用pandas删除dataframe中缺失值的列。

pandas使用dropna函数删除dataframe数据中数据行的内容全部为缺失值的数据行（设置how参数为all）

statistics+insight+vista+power

01-11

473

pandas使用dropna函数删除dataframe数据中数据行的内容全部为缺失值的数据行（设置how参数为all）

Pandas DataFrame 数据处理：删除缺失值的行和列

VnReact的博客

09-14

492

Pandas DataFrame 数据处理：删除缺失值的行和列在数据分析和处理中，经常遇到处理缺失值的情况。Pandas 是一个流行的数据处理库，提供了强大的功能来处理和操作数据。本文将介绍如何使用 Pandas 删除 DataFrame 中包含缺失值的行和列，并给出对应的源代码示例。

使用Pandas的dropna函数删除dataframe中列缺失值的个数大于某一阈值的数据列

学习使你进步。

05-25

613

这里我们创建一个10x5的数据集，其中每一行代表一次实验记录，每一列代表不同的实验指标，包括实验日期、实验员、实验类型、实验结果和实验备注。在数据分析和清洗中，常常会遇到数据中存在缺失值的情况，而对于缺失值较多的列，我们往往会选择将其删除以避免影响后续的统计分析。首先，我们需要计算每列缺失值的个数，然后选取缺失值的比例大于一定阈值的列进行删除。可以看到，我们成功地删除了缺失值比例大于30%的数据列。至此，我们成功地使用Pandas的dropna函数删除了dataframe中缺失值超过一定阈值的数据列。

pandas使用dropna函数删除dataframe数据中包含缺失值的所有数据行（默认dropna删除数据行、行中包含至少一个缺失值则被删除）

statistics+insight+vista+power

08-14

502

pandas使用dropna函数删除dataframe数据中包含缺失值的所有数据行（默认dropna删除数据行、行中包含至少一个缺失值则被删除）

李沐笔记2

jijii123的博客

10-17

275

inouts.mean 不能计算Alley那列, 不能处理文字。用第一种, 比较帅。

Python Pandas DataFrame 删除缺失值 None Nan drop dropna 替换缺失值 fillna 重复值删除 duplicate 数值替换 replace apply

好记性不如烂笔头

09-26

1万+

一、获取缺失值。二、剔除缺失值drop dropna。三、缺失值补全 fillna。四、重复值剔除 duplicate（按照行和列）。五、数值转换 replace apply applymap。

pandas缺失值该怎么处理?

devid008的博客

06-26

2421

在数据分析中，常常会遇到缺失值的问题。对缺失值的恰当处理可以有效提高数据质量和模型的预测精度。Pandas提供了丰富的方法来检测和处理缺失值。本文对这些方法作了详细概括。

python pandas dropna 删除空值/缺失值(DataFrame)

最新发布

06-27

<think>我们有一个任务：删除数据框中所有列都是空字符串的列。空字符串是指由空格、制表符等组成的字符串，还是仅指长度为0的字符串？根据问题，我们假设“全为空字符串”指的是列中所有元素都是空字符串（即长度为0的字符串）或者由空格等空白字符组成的字符串？但问题中并没有明确。然而，在引用[4]中提到了空字符串和NA的区别，引用[3]中提到了空值填充，所以我们需要明确。但是，根据问题描述，用户要求删除的是“全为空字符串”的列，所以我们应该考虑列中的每个元素都是空字符串（即`''`）的情况。然而，有时候用户可能认为由空格组成的字符串（如`''`）也是空字符串，但实际上它们不是。所以我们需要明确：这里我们按照字面意思，将空字符串定义为长度为0的字符串（即`''`）。如果用户需要将空白字符串（whitespace）也视为空，那么应该额外处理。不过，问题中明确说“全为空字符串”，所以我们先考虑空字符串`''`。思路：1.遍历数据框的每一列。2.对于每一列，检查该列的所有元素是否都是空字符串（`''`）。3.如果是，则删除该列。但是，注意：数据框中可能包含非字符串类型的数据。如果某一列不是字符串类型，那么它的元素就不可能是空字符串。因此，我们只关心字符串类型的列吗？还是需要将非字符串列也考虑？因为非字符串列不可能出现空字符串（除非是NaN，但NaN不是空字符串）。所以，我们可以只考虑字符串类型的列吗？但是，用户要求是“全为空字符串的列”，所以非字符串类型的列肯定不会被删除，因为它们的元素不是字符串（也就不会是空字符串）。因此，我们可以对整个数据框进行判断，对于每一列，我们检查每个元素是否是空字符串。但是，如果列中混合了字符串和非字符串，那么该列不可能所有元素都是空字符串（因为非字符串元素肯定不是空字符串）。所以，我们可以安全地遍历每一列。步骤：方法1：使用`apply`方法，结合一个函数，该函数检查一列是否全部由空字符串组成。但是，注意：空字符串`''`和缺失值NaN是不同的。在pandas中，缺失值用NaN表示，而空字符串是字符串的一种。方法2：我们可以对每一列进行判断：`(col=='')`会得到一个布尔序列，然后判断这个布尔序列是否全部为True。但是，这里需要注意，如果列中有NaN，那么`NaN==''`会返回False，所以不会影响判断（因为我们需要全部都是空字符串）。但是，我们还要考虑空白字符串（whitespace）吗？根据问题，我们只考虑空字符串（长度为0）。如果用户希望将空白字符串也视为空，那么我们可以先使用`str.strip()`去除空白，然后检查是否为空字符串。但是，问题没有要求，所以我们先按照空字符串（长度为0）处理。然而，引用[4]中提到：“这一题的关键点在于要将年龄转换为字符串类型”，所以如果列不是字符串类型，我们需要转换吗？但是，如果列不是字符串类型，那么它就不可能是空字符串，所以我们可以跳过。所以，我们只处理字符串列？或者，我们可以将非字符串列转换为字符串再检查？但这样可能会误删非字符串列（例如，数字0转换为字符串'0'，不是空字符串）。所以，我们不需要转换。因此，我们直接判断：对于每一列，如果该列的数据类型是`object`（通常表示字符串或混合类型），那么我们可以检查每个元素是否是空字符串。但是，对于非`object`类型，我们直接认为该列不满足条件（因为不可能有元素是空字符串）。但是，pandas中字符串列也可以是`StringDtype`类型（pandas1.0以后）。所以，更通用的方法是：我们检查列中的每个元素，如果元素是字符串类型，则判断是否为空字符串；如果不是字符串类型，则视为非空字符串（即不符合条件）。这样，我们可以写一个函数来判断单个元素是否为空字符串：然而，这样效率可能不高。我们可以用另一种方法：先选出所有列中数据类型为字符串的列（包括`object`类型和`string`类型），然后在这些列中检查是否全部是空字符串。但是，问题要求删除的是“全为空字符串的列”，所以无论类型如何，只要列中每个元素都是空字符串，就应该删除。所以，我们不应该限制类型。因为有可能一个列被强制转换为字符串类型，然后全是空字符串？但这种情况很少。所以，我们直接判断：对于每一列，检查该列的所有元素是否都是空字符串。注意：如果列中有缺失值（NaN），那么该列就不会全是空字符串（因为NaN不等于空字符串）。所以，我们不用担心缺失值。具体步骤：1.使用`df.apply`结合一个lambda函数：`df.apply(lambdacol:col.map(lambdax:x=='').all())`，这样会得到一个布尔序列，索引是列名，值为True表示该列所有元素都是空字符串。2.然后，我们选择这些列，并删除。但是，上面的方法有一个问题：如果列中包含非字符串元素，那么`x==''`可能会出错（比如数值类型）或者返回False（比如数值类型不会等于空字符串）。所以，我们可以先判断元素类型是否为字符串，如果是再比较，否则返回False。改进：我们可以写一个函数来判断一个元素是否是空字符串：defis_empty_string(x):ifisinstance(x,str):returnx==''returnFalse然后，对每一列：`col.map(is_empty_string).all()`但是，这样写效率可能不高，因为要遍历每个元素。另一种方法：我们可以使用向量化的字符串操作，但pandas的字符串方法只适用于字符串序列。所以，我们可以先选择字符串类型的列，然后在这些列上使用`.str.len()==0`来检查是否为空字符串。步骤：-首先，选择所有字符串类型的列：`df.select_dtypes(include=['object','string'])`-然后，对这些列，检查每列是否所有元素的字符串长度都为0：`(selected_cols.apply(lambdacol:col.str.len()==0)).all()`-这样得到一个布尔序列，表示这些列中哪些列全部是空字符串。-然后，我们得到这些列名，并在原数据框中删除。但是，这种方法只检查了字符串类型的列，而其他类型的列我们不需要检查（因为不可能全是空字符串）。所以，这样是合理的。但是，用户要求的是删除全为空字符串的列，所以我们可以这样：-先找出所有字符串列中满足条件的列（即全为空字符串的列）的列名。-然后，从整个数据框中删除这些列。注意：可能有些列是字符串类型，但并不是全为空字符串，我们就不删除。具体代码：步骤1：找出字符串列（包括object和string类型）string_cols=df.select_dtypes(include=['object','string']).columns步骤2：创建一个列表，用于存储要删除的列名to_drop=[]forcolinstring_cols:#检查该列是否全部由空字符串组成if(df[col].astype(str)=='').all():to_drop.append(col)但是，这里我们将非字符串列转换为了字符串，然后判断是否为空字符串？这样可能不好，因为非字符串列转换后，比如数字0会变成'0'，不是空字符串。但我们这里已经选择了字符串列，所以不需要转换？但是，我们选择的字符串列中，可能有些元素是NaN（在object类型中，NaN是浮点数，所以会被排除在字符串列之外？）实际上，在pandas中，一个列如果是object类型，可能混合了字符串和NaN（NaN是float类型），所以当我们使用`df[col].astype(str)`时，NaN会变成字符串`'nan'`，这不是空字符串。所以，我们不需要担心NaN。但是，我们也可以不转换：对于字符串列，我们可以直接使用向量化字符串操作（.str）来获取长度，但注意，如果列中有NaN，那么`.str`方法会返回NaN，所以我们需要将NaN视为非空字符串？或者用`fillna`填充为非空字符串？但这样会改变判断。另一种方法：我们直接使用`(df[col]=='')`，对于非字符串元素，它会返回False（因为非字符串元素不可能等于空字符串），这样我们就可以判断。所以，我们可以这样：if(df[col]=='').all():to_drop.append(col)但是，如果列中有NaN，`df[col]==''`会对NaN返回False，所以不会影响判断（因为我们需要全部都是True才满足条件）。所以，我们可以用这个方法。但是，注意：如果列中既有空字符串又有NaN，那么`(df[col]=='')`会返回一些False（因为NaN的位置是False），所以该列不会被判定为全为空字符串。因此，我们直接：to_drop=[colforcolindf.columnsif(df[col]=='').all()]但是，这个列表推导式会遍历每一列，对于非字符串列，`df[col]==''`会返回一个全为False的序列（因为非字符串列的元素都不等于空字符串），所以`all()`会返回False。因此，我们不需要区分列的类型，直接对整个数据框进行操作。然而，我们担心效率问题：如果数据框很大，列很多，这样遍历每一列并比较可能会慢。但通常列不会特别多。所以，我们可以这样写：df=df.loc[:,~(df=='').all()]但是，这个操作会检查整个数据框的每一个元素是否等于空字符串，然后按列取all（得到一个布尔序列，表示每一列是否全部等于空字符串），然后取反（~）选择不满足条件的列（即不全为空字符串的列）。但是，这里有一个问题：对于非字符串列，该列的元素与空字符串比较，会返回False（因为非字符串不可能等于空字符串），所以这些列不会被删除，符合要求。因此，一行代码即可：df=df.loc[:,~(df=='').all(axis=0)]或者：df=df.drop(columns=df.columns[(df=='').all()])但是，注意：`(df=='')`会生成一个与df相同形状的布尔数据框，然后`.all(axis=0)`会按列进行all操作，返回一个布尔序列（列名作为索引）。然后，我们选择那些不是全为True的列。但是，这种方法可能会遇到问题：如果数据框中有其他类型的元素（比如数值、日期等），它们与空字符串比较会产生什么？在pandas中，不同数据类型比较通常返回False。所以，没有问题。然而，还有一个问题：如果列中有缺失值（NaN），那么`df[col]==''`在NaN的位置会返回False，所以不会影响判断。因此，这个方法可行。但是，用户可能希望将空白字符串（比如多个空格）也视为空，那么我们可以先去除空白，然后再判断是否为空字符串？但问题没有要求，所以我们先不考虑。因此，我们给出两种方法：方法1：直接使用布尔索引删除列（简洁）方法2：显式遍历列（可能更清晰，但代码稍长）我们选择方法1，因为它简洁。但是，注意：如果数据框很大，`(df=='')`会创建一个很大的布尔数据框，可能会消耗内存。如果内存紧张，我们可以使用循环逐列处理。另外，我们还需要考虑一种情况：列中可能包含None。在pandas中，None在object列中，当与空字符串比较时，`None==''`会返回False（因为None不等于空字符串）。所以，不会影响判断。因此，最终代码：df=df.loc[:,~(df=='').all(axis=0)]但是，我们也可以使用：df=df.drop(columns=df.columns[(df=='').all()])两种方法都可以。我们写一个示例来测试：示例数据：importpandasaspddf=pd.DataFrame({'A':['','',''],'B':['','',''],'C':['','a',''],'D':[1,2,3],'E':['','',None]})我们想删除列'A'（因为全是空字符串），而列'B'不是（因为它们是空格，不是空字符串），列'C'不是（因为有一个'a'），列'D'不是（数值），列'E'不是（因为有一个None）。执行`(df=='')`:ABCDE0TrueFalseTrueFalseTrue1TrueFalseFalseFalseTrue2TrueFalseTrueFalseFalse然后按列取all：A:True(因为三个True)B:False(因为三个False)C:False(因为第二行是False)D:FalseE:False(因为第三行是False)所以，只有列A会被删除。但是，注意列B：它是空格字符串，我们并没有删除它。如果用户希望删除全为空白字符串的列，我们需要额外处理。如果用户要求删除全为空白字符串的列，我们可以：#先创建一个函数，判断一个元素是否是空白字符串（即去除首尾空白后长度为0）defis_whitespace_string(x):ifisinstance(x,str):returnx.strip()==''returnFalse然后，使用：to_drop=[]forcolindf.columns:#对列中的每个元素应用函数ifall(is_whitespace_string(x)forxindf[col]):to_drop.append(col)df=df.drop(columns=to_drop)但是，这样写效率较低（使用循环遍历每个元素）。或者，我们可以使用向量化操作（但需要处理非字符串列）：#创建一个布尔数据框，其中每个元素是否在去除空白后为空字符串#但是，没有直接的向量化方法，因为非字符串列没有strip方法。#我们可以这样：先选择字符串列，然后使用str.stripstring_cols=df.select_dtypes(include=['object','string']).columns#创建一个临时的数据框，只包含字符串列，并应用striptemp=df[string_cols].apply(lambdacol:col.str.strip()ifcol.dtype=='object'orcol.dtype=='string'elsecol)#然后判断temp中的每个元素是否等于空字符串mask=(temp=='').all(axis=0)#得到要删除的列to_drop=mask[mask].indexdf=df.drop(columns=to_drop)但是，这个方法只能处理字符串列，而且需要额外的内存。考虑到用户问题中只要求“空字符串”，我们按照字面意思处理（即长度为0的字符串）。所以，我们使用第一种方法（直接比较`''`）即可。因此，最终答案：使用`df=df.loc[:,~(df=='').all(axis=0)]`删除全为空字符串的列。但是，我们还需要注意：如果数据框很大，这种方法可能会产生一个临时的布尔数据框，占用内存。如果内存不足，我们可以使用循环：cols_to_drop=[]forcolindf.columns:#检查该列是否所有元素都等于空字符串if(df[col]=='').all():cols_to_drop.append(col)df=df.drop(columns=cols_to_drop)这种方法不会创建整个布尔数据框，而是逐列处理，内存占用较小。因此，我们提供两种方法，并说明适用场景。根据引用[^1][^2][^3][^4]，我们注意到用户之前可能在使用pandas处理字符串列，所以我们的方法应该符合用户的数据结构。最后，我们给出代码示例：方法1（简洁，但可能占用内存）：df=df.loc[:,~(df=='').all(axis=0)]方法2（节省内存）：cols_to_drop=[colforcolindf.columnsif(df[col]=='').all()]df=df.drop(columns=cols_to_drop)方法2使用列表推导式，同样会创建一个临时的布尔列表（但每个元素是一个标量布尔值，而不是整个列），所以内存占用比方法1小。因此，我们推荐方法2。但是，注意：在方法2中，`(df[col]=='')`会生成一个布尔序列，然后`all()`将其缩减为一个布尔值。所以，对于每一列，我们只需要存储一个布尔值，因此内存占用是O(列数)，而方法1是O(数据框大小)。所以，方法2更优。因此，我们选择方法2。示例代码：importpandasaspd#创建示例数据data={'col1':['','',''],'col2':['a','','b'],'col3':[1,2,3],'col4':['','','']}df=pd.DataFrame(data)#删除全为空字符串的列cols_to_drop=[colforcolindf.columnsif(df[col]=='').all()]df_dropped=df.drop(columns=cols_to_drop)print("原始数据框：")print(df)print("删除后：")print(df_dropped)输出：原始数据框：col1col2col3col40a1122b3删除后：col2col3col40a1122b3注意：col1被删除，因为全是空字符串；col4没有被删除，因为其中有一个元素是空格（不是空字符串）。如果用户希望删除全为空白字符串的列，我们可以稍作修改：#定义一个函数，判断元素是否为空白字符串defis_whitespace_or_empty(s):ifisinstance(s,str):returns.strip()==''returnFalse#然后，检查每一列：如果该列的所有元素都满足is_whitespace_or_empty，则删除cols_to_drop=[]forcolindf.columns:#使用apply或者map对列中每个元素应用函数，然后判断是否全部为Trueifall(df[col].apply(is_whitespace_or_empty)):cols_to_drop.append(col)df=df.drop(columns=cols_to_drop)但是，这种方法会遍历每个元素，效率较低，但适用于小规模数据。根据用户需求，我们提供基础版本（仅删除全为空字符串的列）和扩展版本（删除全为空白字符串的列）。现在，我们回答用户问题：在pandas中，删除全为空字符串的列，可以使用以下代码：cols_to_drop=[colforcolindf.columnsif(df[col]=='').all()]df=df.drop(columns=cols_to_drop)或者，如果用户希望将空白字符串（如空格、制表符等）也视为空，则使用：defis_whitespace_empty(x):returnisinstance(x,str)andx.strip()==''cols_to_drop=[colforcolindf.columnsifdf[col].apply(is_whitespace_empty).all()]df=df.drop(columns=cols_to_drop)注意：第二种方法会逐元素检查，可能比较慢。因此，我们推荐用户根据实际需求选择。最后，我们生成相关问题：</think>在 Pandas 中删除全为空字符串的列，可通过以下步骤实现： ### 解决方案 ```python import pandas as pd # 方法1：直接筛选非全空字符串的列 df = df.loc[:, ~(df.astype(str) == '').all()] # 方法2：分步操作（更易读） empty_cols = [col for col in df.columns if (df[col].astype(str) == '').all()] df = df.drop(columns=empty_cols) ``` ### 关键说明 1. **`df.astype(str)`** 将全列转为字符串类型，避免因混合数据类型（如数值+字符串）导致的比较错误。 2. **`(df.astype(str) == '')`** 生成布尔矩阵，标记所有空字符串`''`的位置。 3. **`.all()`** 按列检查是否**所有元素**都满足条件（即全为空字符串）。 4. **`~` 或列表推导** 取反操作保留非全空列，或直接生成待删除的列名列表。 ### 示例演示 ```python import pandas as pd # 创建含空字符串列的示例数据 data = { 'A': ['', '', ''], 'B': ['a', '', 'b'], 'C': [1, 2, 3], 'D': ['', ' ', ''] # 含空格的非空字符串 } df = pd.DataFrame(data) # 执行删除 df_cleaned = df.loc[:, ~(df.astype(str) == '').all()] print("清理后列名:", df_cleaned.columns.tolist()) # 输出: ['B', 'C', 'D'] (A列被删除) ``` ### 注意事项 - **空字符串 vs 空格字符串**：此方法只删除严格意义上的空字符串`''`，若需删除全空白字符（如空格、制表符），需额外处理： ```python # 删除全空白字符的列 whitespace_cols = [col for col in df.columns if df[col].apply(lambda x: str(x).strip() == '').all()] df = df.drop(columns=whitespace_cols) ``` - **与缺失值 `NaN` 的区别**：空字符串 `''` 是有效字符串，而 `NaN` 表示缺失值。若需同时处理缺失值，需结合 `.fillna('')`[^3]。 ### 相关问题 1. 如何删除 Pandas 中**全为空白字符**（如空格、制表符）的列？ 2. 如何区分处理数据框中的**空字符串 `''`** 和 **`NaN` 缺失值**？[^3] 3. 如何删除同时满足**空字符串+缺失值混合**的列？ 4. 如何批量删除**低频率的有效数据列**（如99%为空值的列）？[^2] --- 以上实现基于 Pandas 的向量化操作，确保高效处理大型数据集。可根据实际需求扩展对空白字符或混合类型的处理逻辑。 [^1]: 关于 DataFrame 的索引和列操作 [^2]: 使用 `describe()` 进行列统计 [^3]: 空字符串与 `NaN` 的区别处理 [^4]: 字符串类型转换与匹配操作