pandas.DataFrame.drop_duplicates

原创已于 2023-02-16 10:39:31 修改 · 160 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python

于 2023-02-16 10:38:37 首次发布

Python 专栏收录该内容

32 篇文章

订阅专栏

文章介绍了如何使用pandas库中的drop_duplicates函数来移除DataFrame数据框中的重复行。该函数可以考虑特定列，并忽略包括时间索引在内的索引。示例展示了在不同参数设置下，如何处理行的重复性。

一、用法

Return DataFrame with duplicate rows removed.
Considering certain columns is optional. Indexes, including time indexes are ignored.

二、代码实现

import pandas as pd
df = pd.DataFrame({'A':[1,2,2],'B':[3,3,1]})
df

df.drop_duplicates(keep='first')
# 对于‘A’，第二、三行重复，对于‘B’，第二、三行不重复 ==> 对于df，第二、三行不重复
# 对于‘B’，第一、二行重复，对于‘A’，第一、二行不重复 ==> 对于df，第一、二行不重复
# 对于df，第一、二、三行都不重复

df[['A']].drop_duplicates(keep='first')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SmartDemo

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

精选资源

详解pandas使用drop_duplicates去除DataFrame重复项参数

01-01

Pandas之drop_duplicates：去除重复项方法 DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) 参数这个drop_duplicate方法是对DataFrame格式的数据，去除特定列下面的重复行。返回...

pandas.DataFrame.drop_duplicates 用法介绍

09-16

主要介绍了pandas.DataFrame.drop_duplicates 用法介绍，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

参与评论您还未登录，请先登录后发表或查看评论

pandas.DataFrame.drop_duplicates 用法说明

weixin_30322405的博客

10-23

417

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) subset考虑重复发生在哪一列，默认考虑所有列，就是在任何一列上出现重复都算作是重复数据 keep 包含三个参数first, last, False，first是指，保留搜索到的第一个重复数据，之后的都删除；last是指，保留搜索到的最后一个重复数据，之前的搜索...

pandas：去重函数 pandas.DataFrame.drop_duplicates

错位的梦寐的博客

10-30

1040

- 1、官方文档： df.drop_duplicates? Signature: df.drop_duplicates(subset=None, keep='first', inplace=False) Docstring: Return DataFrame with duplicate rows removed, optionally only considering certain colum...

[Pandas] DataFrame.drop_duplicates() 删除重复值

Hudas的博客

02-14

6016

Pandas DataFrame.drop_duplicates() 删除重复值

Pandas 模块-操纵数据(8)-去除重复行 .drop_duplicates()

一分耕耘一分收获

12-09

5069

DataFrame.drop_duplicates(subset: 'Optional[Union[Hashable, Sequence[Hashable]]]' = None, keep: 'Union[str, bool]' = 'first', inplace: 'bool' = False, ignore_index: 'bool' = False)

无涯教程-DataFrame.drop_duplicates函数

无涯教程

06-18

608

drop_duplicates()函数执行常见的数据清理任务，该任务处理DataFrame中的重复值。此方法有助于从DataFrame中删除重复的值。

pandas dataframe merge concat drop_duplicates

最新发布

10-25

`drop_duplicates`方法是Pandas中用于处理重复数据的一个非常有用的工具。通过深入了解其用法和参数，可以更精确地控制重复数据的处理方式。以下是一个使用示例： ```python import pandas as pd # 创建一个包含...

pandas中drop_duplicates()函数

xiaofeixia002X的博客

12-10

369

默认保留第一次出现的重复项 (keep='first')。默认检查所有列。列中数据类型不同的值不会被认为重复。若设置为 True，操作会直接修改原对象，不会返回新对象。

Pandas知识点-drop和drop_duplicates最全总结

weixin_43790276的博客

03-08

3293

pandas系列。

『Python - Pandas』drop_duplicates方法失效的探索及一种解决方法

m0_47149835的博客

12-03

2359

drop_duplicates 方法失效的原因以及相应解决方案

pandas dataframe去除重复数据pandas.DataFrame.drop_duplicates

qq_27361945的博客

10-28

1791

例子： df2 = pd.DataFrame({'工参中没有的cgi': self.mismatchedcgis}) # subset='工参中没有的cgi' 表示只考虑列名为：工参中没有的cgi 这一列的重复项，不设则需考虑全部列，也可以设成多列 # inplace=True是直接在df2表中删除重复项，如果设成inplace=False则不修...

利用Pandas来清除重复数据

LW的技术小筑

02-09

2万+

一.前言最近刚好在练手一个数据挖掘的项目，众所周知，数据挖掘中比较重要的一步为数据清洗，而对重复数据的处理也是数据清洗中经常碰到的一项。本文将仅介绍如何利用Pandas来清除重复数据(主要指重复行)，话不多说请看下文。二.具体介绍 2.1. 导入Pandas库 pandas是python的核心数据分析库，你可以把它理解为python版的excel，倘若你还没有安装相应的库，请查询相关教程进行安...

pandas进阶--Dataframe的drop_duplicates方法(数据去重)

qq_38727995的博客

04-28

1万+

本文介绍了实际处理数据是常用的数据去重方法，即Dataframe的drop_duplicates方法，包括drop_duplicates方法的具体介绍、以及传递不同函数时的使用用例。

pandas使用drop_duplicates去除DataFrame重复项参数详解

热门推荐

tomato_guo的博客

04-16

7万+

DataFrame中存在重复的行或者几行中某几列的值重复，这时候需要去掉重复行，示例如下： data.drop_duplicates(subset=['A','B'],keep='first',inplace=True) 代码中subset对应的值是列名，表示只考虑这两列，将这两列对应值相同的行进行去重。默认值为subset=None表示考虑所有列。 keep='first'表示保留第一次...

pandas小记：pandas数据规整化-缺失、冗余、替换

皮皮blog

09-22

1万+

http://blog.csdn.net/pipisorry/article/details/39482861 处理缺失数据缺失数据（missing data)在大部分数据分析应用中都很常见。pandas的设计目标之一就是让缺失数据的处理任务尽量轻松，pandas对象上的所有描述统计都排除了缺失数据。 pandas使用浮点NaN (Not a Number)表示浮点和非浮点数组中的缺失数据，...

【python】详解pandas dataframe 去重函数 pandas.DataFrame.drop_duplicates

brucewong0516的博客

04-18

3万+

- 1、首先直接看文档： df.drop_duplicates? Signature: df.drop_duplicates(subset=None, keep='first', inplace=False) Docstring: Return DataFrame with duplicate rows removed, optionally only considering certain...

python的drop_duplicates_Python pandas.DataFrame.drop_duplicates函数方法的使用

weixin_39944638的博客

12-11

647

DataFrame.drop_duplicates(self，subset = None，keep ='first'，inplace = False)返回删除了重复行的DataFrame，可选择仅考虑某些列。包括时间索引在内的索引将被忽略。参数：subset：列标签或标签序列，可选仅考虑用于标识重复项的某些列，默认情况下使用所有列keep：{'first'，'last'，False}，默认'...

[pandas] DataFrame drop_duplicates() 删除重复行数据去重

weixin_43988131的博客

09-08

851

DataFrame drop_duplicates() 删除重复行 dfLancome = dfLancome.drop_duplicates()