python Dataframe 根据某一列的值来删除多行

Python Dataframe高效删除行：依据列值筛选

最新推荐文章于 2025-04-05 16:32:03 发布

原创最新推荐文章于 2025-04-05 16:32:03 发布 · 3.2k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#python #Dataframe

python 专栏收录该内容

65 篇文章

订阅专栏

本文介绍了两种快速删除Python pandas DataFrame中特定列值对应行的方法：使用`~df.b.isin(my_list)`和`df.query('@my_list not in b')`。这两种方法在处理大量数据时比循环删除index的方法效率更高，适合大数据场景。通过实例展示了如何根据列表`my_list`过滤掉DataFrame中'abc'列值在列表内的行。

python Dataframe 根据某一列的值来删除多行

在Dataframe中，有的时候想根据某一列值来删除。

方法一：你可以做负isin()索引：

In [57]: df
Out[57]:
   a  b  c
0  1  2  2
1  1  7  0
2  3  7  1
3  3  2  7
4  1  3  1
5  3  4  2
6  0  7  1
7  5  4  3
8  6  1  0
9  3  2  0
In [58]: my_list = [1, 7, 8]

In [59]: df.loc[~df.b.isin(my_list)]
Out[59]:
   a  b  c
0  1  2  2
3  3  2  7
4  1  3  1
5  3  4  2
7  5  4  3
9  3  2  0

方法二：query

In [60]: df.query('@my_list not in b')
Out[60]:
   a  b  c
0  1  2  2
3  3  2  7
4  1  3  1
5  3  4  2
7  5  4  3
9  3  2  0

以前我使用的笨方法是循环删index的方法，在drou_index操作，当数据特别大的时候，特别慢。
换成上面的方法，速度很快！
人生苦短，我用python！！！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

GhostintheCode

关注关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用 Python Pandas 删除 DataFrame 中指定位置的多行数据

持续更新

04-23

1587

函数将返回一个新的 DataFrame，该 DataFrame 中已经删除了指定的行。在进行数据分析和处理时，我们经常需要删除不必要的数据。通过这种方法，我们可以方便地删除 DataFrame 中的多个指定行。接下来，假设我们要删除索引为 1 和 2 的两行数据，我们可以使用。函数还支持按条件删除行或列，或者通过标签删除行或列等操作。在这里，我们传递了一个包含要删除的行索引的列表作为参数。函数删除 DataFrame 中的指定行。下面我们将介绍如何在 Pandas 中使用。函数删除指定位置的多行数据。

python数据分析-DataFrame根据某列的数据判断，删除满足条件的数据所在的行

qq_40395868的博客

05-08

4427

问题：有一个DataFrame，有一列数据是日期的数据，但是数据类型不是日期型，而且，需求是空的保留，删除日期在2020-01-01前的数据所在的行。 a = pd.DataFrame({'one':[1,2,3,4,5],'two':['2021-03-01','','2019-12-27','','2020-01-01'],'three':['','ss','',11,'gg']}) for i in range(len(a)): if a['two'][i].strip()=='':

参与评论您还未登录，请先登录后发表或查看评论

在pandas中一次性删除dataframe的多个列方法

09-20

下面小编就为大家分享一篇在pandas中一次性删除dataframe的多个列方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

DataFrame删除行和列

一路前行

09-14

9万+

本文通过一个csv实例文件来展示如何删除Pandas.DataFrame的行和列数据文件名为:example.csv内容为：date spring summer autumn winter 2000 12.2338809 16.90730113 15.69238313 14.08596223 2001 12.84748057 16.75046873 14.51406637 13.5037456 20

dataFrame删除数据

yujiajun1024的博客

03-14

2245

inplace: 默认为False，该删除操作不改变原数据；inplace = True时，改变原数据。columns：直接指定要删除的列，删除多列可以使用列表作为参数。axis：默认为0，指要删除的是行，删除列时需指定axis为1。index ：直接指定要删除的行，删除多行可以使用列表作为参数。labels：要删除的行或列，用列表给出。

Python DataFrame一列拆成多列以及一行拆成多行

09-18

在数据分析过程中，有时需要对DataFrame的数据结构进行调整，如将一列拆分为多列或把一行数据拆分成多行。Python的pandas库中的DataFrame提供了丰富的功能来处理这类问题。以下我们将详细介绍如何实现这两个目标。 ...

Python Pandas中根据列的值选取多行数据

09-19

当我们需要根据列的特定值来筛选DataFrame中的行时，Pandas提供了一系列便捷的方法。下面将详细介绍如何在Pandas中根据列的值选取多行数据。 1. **选取等于某些值的行记录**：使用`==`操作符可以选取DataFrame中...

python dataframe 输出结果整行显示的方法

09-20

当DataFrame的列数过多或者列名较长时，为了适应控制台或Jupyter notebook的宽度，pandas会自动调整显示方式，将一列数据分割成多行显示。这种情况下，数据的可读性会受到影响，尤其是在列数很大的时候。为了解决...

将 DataFrame 中某一列的列表拆分成多个独立的列的方式

爱学习的capoo的博客

04-05

581

将列表元素拆分成多行（每行一个元素），适合后续聚合或统计每个元素出现的次数。将列表元素转换为布尔列（每个元素为一列，存在则为。的列，适合固定长度的列表或保留元素顺序。根据分析目标选择最合适的方法即可！假设 DataFrame 中。将列表元素按位置拆分成。如果原数据是字符串（如。

pandas根据某列的值删除某行_python学习之路---pandas预处理常用操作

weixin_39683598的博客

11-27

2890

python常用于数据分析，主要是因为有了数据分析利器--pandas。前两期已经介绍了pandas的数据结构、读写操作等，今天主要介绍一下常用的数据分析预处理的操作，分别是：(1)缺失值处理：dropna(),fillna()(2)重复值处理：drop_duplicates()(3)离散化：cut(),qcut()(4)分组聚合：groupby()(5)数据透视表：pivot_table()(6...

dataframe中删除某一列或某一行

最新发布

09-23

<think> 我们参考多个引用内容，特别是引用[2]和引用[3]提供的方法，来处理将DataFrame中的一行根据分隔符拆分成多行的需求。引用[2]中展示的方法是：先使用split分割字符串，然后使用stack()来展开，最后与原数据合并。引用[3]中展示了两种方法：一种是用split分割并展开为多列，然后使用explode方法将多列中的列表拆分多行（注意：在引用[3]的示例中，拆分成多列后，再使用explode方法，但实际上在pandas 0.25版本之后，可以直接使用explode方法将包含列表的列拆分成多行）。根据用户需求，我们只需要将一行拆分成多行（而不是拆成多列再拼接），因此我们可以采用以下步骤： 1. 使用split方法将需要拆分的列分割成列表（注意：这里不展开成多列，而是生成一个列表列）。 2. 使用explode方法将列表列中的每个元素拆分成一行。具体步骤如下（以引用[3]中的例子说明）：原始数据： A B C 0 a1 a2 a3_a4 1 b4 b5 b6_b7 我们需要将C列按照分隔符'_'进行拆分，使得每一行在C列上的一个元素变成一行，同时保留其他列。步骤： 1. 将C列转换成列表：使用apply或map函数配合split。 df['C'] = df['C'].str.split('_') # 这样C列将变成列表，例如第一行变成['a3','a4'] 2. 使用explode方法将列表拆分成多行： df = df.explode('C') 这样，第一行会拆分成两行：一行C为'a3'，另一行C为'a4'，同时A列和B列的值会重复。注意：在pandas 0.25.0及以上版本支持explode方法。如果版本较低，则需要使用其他方法（如引用[2]中的方法）。引用[2]中的方法（适用于低版本）： df = ( df.drop('C', axis=1) # 先删除C列 .join( # 然后将拆分后的结果与剩余部分连接 df['C'].str.split(' ', expand=True) # 注意：这里引用[2]中用的是空格分隔，我们根据实际情况改成对应分隔符 .stack() # 堆叠，将多列变成多行 .reset_index(level=1, drop=True) # 重置索引，删除多余的索引 .rename('C') # 重命名列 ) ) 但用户的问题中并没有指定分隔符是什么，假设是空格或者下划线，我们可以根据实际情况调整。为了通用性，我们以用户提供的分隔符为准（假设为逗号','，但问题中没有给出，所以需要用户自行替换）。在下面的示例中，我们假设分隔符是下划线'_'。因此，我们推荐使用explode方法（简洁高效），但也要注意版本要求。下面给出两种方法的代码示例：方法一（推荐，使用explode，要求pandas>=0.25.0）：步骤： df['需要拆分的列'] = df['需要拆分的列'].str.split(分隔符) df_exploded = df.explode('需要拆分的列') 方法二（适用于低版本）：步骤： # 注意：这里我们参考引用[2]的方法，但原文中分隔符是空格，我们替换成实际分隔符 split_df = df['需要拆分的列'].str.split(分隔符, expand=True) # 分割成多列 # 然后将多列堆叠（stack）成一列，这样每行就会变成多行 stacked = split_df.stack().reset_index(level=1, drop=True).rename('需要拆分的列') # 删除原DataFrame中需要拆分的列，并与堆叠后的结果连接 df_exploded = df.drop('需要拆分的列', axis=1).join(stacked) 下面我们用一个具体例子（分隔符为'_'）来演示两种方法。原始数据： import pandas as pd df = pd.DataFrame({ 'A': ['a1', 'b4'], 'B': ['a2', 'b5'], 'C': ['a3_a4', 'b6_b7'] }) 目标：将C列按'_'拆分，使得每一行拆成两行（因为有两个元素），得到： A B C 0 a1 a2 a3 0 a1 a2 a4 # 注意索引重复，可以使用reset_index重置索引 1 b4 b5 b6 1 b4 b5 b7 方法一代码： df['C'] = df['C'].str.split('_') df_exploded = df.explode('C').reset_index(drop=True) # reset_index可以重置索引，避免重复索引方法二代码： split_df = df['C'].str.split('_', expand=True) stacked = split_df.stack().reset_index(level=1, drop=True).rename('C') df_exploded = df.drop('C', axis=1).join(stacked).reset_index(drop=True) 注意：两种方法得到的df_exploded可能会有不同的索引，我们使用reset_index(drop=True)重置索引。根据用户需求，我们推荐使用explode方法（方法一），因为它更简洁。但请确保pandas版本足够。因此，我们给出最终解决方案：步骤： 1. 将需要拆分的列使用split函数按照分隔符分割成列表。 2. 使用explode方法将该列拆分成多行。 3. 可选：重置索引。代码示例： import pandas as pd # 假设df是原始DataFrame，分隔符为sep（比如'_'） # 假设要拆分的列名为'column_name' df['column_name'] = df['column_name'].str.split(sep) df = df.explode('column_name').reset_index(drop=True) 注意：如果原始列中可能包含空值（NaN）或者非字符串类型，需要先处理（例如填充空值或转换为字符串）。此外，如果拆分后需要同时拆分多个列，则需要分别处理，但explode一次只能处理一列（但可以连续调用explode处理多列，但要小心笛卡尔积）。如果需要同时根据多列拆分，且这些列的分隔符相同，并且每列拆分的元素个数相同，那么可以分别拆分然后合并。但这种情况较少，通常我们一次只拆分一列。因此，针对用户的需求，我们提供上述解决方案。下面生成相关问题。 </think> ### Python DataFrame根据分隔符将一行拆分成多行在Pandas中，根据分隔符将一行数据拆分成多行数据有两种主流方法，核心步骤和示例如下： #### 方法一：使用`str.split()` + `explode()`（推荐） ```python import pandas as pd # 原始数据 df = pd.DataFrame({ 'A': ['a1', 'b4'], 'B': ['a2', 'b5'], 'C': ['a3_a4', 'b6_b7_b8'] # 需要拆分的列 }) # 拆分步骤 df['C'] = df['C'].str.split('_') # 按分隔符'_'分割成列表 df = df.explode('C').reset_index(drop=True) # 展开列表为多行 ``` **输出结果**： | | A | B | C | |-----|-----|-----|-----| | 0 | a1 | a2 | a3 | | 1 | a1 | a2 | a4 | | 2 | b4 | b5 | b6 | | 3 | b4 | b5 | b7 | | 4 | b4 | b5 | b8 | #### 方法二：使用`str.split()` + `stack()`（兼容旧版本） ```python # 拆分步骤 split_col = ( df['C'].str.split('_', expand=True) # 分割成多列 .stack() # 转换为垂直方向的多行 .reset_index(level=1, drop=True) # 删除多余索引 .rename('C') # 重命名列 ) result = df.drop('C', axis=1).join(split_col) # 拼接结果 ``` #### 关键说明： 1. **分隔符处理**：将目标列（如`C`列）通过`str.split('分隔符')`转换为列表 2. **行展开**： - `explode()`（Pandas 0.25+）直接展开列表为多行[^3] - `stack()`通过堆叠实现多列转多行[^2] 3. **索引重置**：`reset_index(drop=True)`避免索引重复 4. **空值处理**：拆分时遇到空值可用`df['col'].fillna('')`预处理 > **适用场景**：处理地址、标签、多值属性等字段（如`"北京,上海,广州"`拆分为三行）[^4]。