【Python_010】利用python对excel进行去重

最新推荐文章于 2024-06-24 16:33:49 发布

原创

最新推荐文章于 2024-06-24 16:33:49 发布 · 4k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍了如何使用Python的pandas库中的drop_duplicates函数对Excel数据进行去重操作。通过设置subset参数指定按特定列去重，同时讲解了inplace和keep参数的用法，演示了保留首次出现值的过程。

写在前面的Tips：

使用函数drop_duplicates
其中参数subset可以指定按照某字段进行去重。效果如下图
参数inpalce默认为False，若为True则直接在原数据上做修改（不推荐，风险较大）
参数keep，若='first’则保留第一次出现的值，若='last’保留最后一次出现的值，若='false’表示一条都不保留

下面是代码演示

import pandas as pd
import openpyxl

datadir = r"C:\Users\Haley\Desktop\test_duplicates_data.xlsx"

data = pd.read_excel(datadir, sheet_name='OriginalData')

da

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Haaaley

关注关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

EXCEL、SQL、Python去重的方式分别是什么？

rubyw的博客

07-10

1251

DISTINCTcolumn1column1column2GROUP BYMIN()MAX()column1column2EXISTScolumn1column2这些方法可以根据具体情况选择合适的去重策略，在处理复杂的数据去重需求时特别有用。如果有特定的数据处理场景或者更多的问题，请随时告诉我！setpandaspandas在 Python 中，通常使用不同的方法来处理列表或者数组中的唯一值。这取决于你使用的数据结构和需要的功能。

python 删除excel表格重复行,数据预处理操作

09-16

主要介绍了python 删除excel表格重复行,数据预处理操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

1 条评论您还未登录，请先登录后发表或查看评论

python给excel的列数据去重

11-19

https://pypi.org/project/xlrd/ xlrd是1.2的版本 https://pypi.org/project/xlwt/ 分别下载tar.gz 文件解压后的文件夹，cmd python setup.py install

几行Python代码，轻松搞定Excel表格数据去重

SRE成长记

01-13

3545

几行Python代码，轻松搞定Excel表格数据去重

Python读excel去重

ChenADC的博客

10-06

905

@Python读excel去重 Python读excel去重 excel里某一行重去，去掉这一行，直接上代码一段漂亮的代码 // An highlighted block import xlrd #打开excel文件 import math; #将创建的属性字段删除——读取 data = xlrd.open_workbook('PoiDownload_fz11resout.xls') #打开Excel文件读取数据 sh = data.sheet

python excel表格去重_都说Excel大法好，Python大法其实也不错，批量去重处理更是神啊...

weixin_32161925的博客

02-09

1042

Excel操作大法好啊！在面对一大堆数据的时候，只需要点击一下工具栏就可以了，轻松筛选自己需要的数据了对于那些没用的，自己不想要的数据，也可以搜索到并一键去处。在那些我们不需要的数据中，有一个大类叫做重复数据。针对这个重复数据，想必操作Excel的朋友们都会经常用，所以Excel工具栏有专门针对去重操作的处理按钮，非常明显。但是如果让你对着一大堆的Excel表格一直进行去重操作呢？不知道你们是啥想...

Python学习笔记_读Excel去重

weixin_33758863的博客

03-03

629

读取一个Excel文件，按照某列关键字，如果有重复则去掉这里不介绍所有的解决办法，只是列出一个办法。软件环境： OS：Win10 64位 Python 3.7 测试路径:D:\Work\Python 测试的Excel文件:Test1.xlsx 参考代码： #! -*- coding utf-8 -*- #! @Tim...

Python对列表去重的多种方法(四种方法)

12-23

另一种方法是利用Python字典的特性，创建一个空字典，然后用列表的元素作为键，由于字典键的唯一性，这同样可以达到去重的效果。同样，这种方法也不能保持原有顺序： ```python orgList = [1, 0, 3, 7, 7, 5] ...

python对excel文档去重及求和的实例

09-20

以上知识点展示了如何使用Python进行简单的Excel数据操作，包括读取数据、处理数据和写入数据。这不仅需要Python编程基础，还需要对操作Excel文件的库有一定的了解。这类技能在数据处理、自动化办公等场景中非常实用...

python对excel表某一列去重

phoenix3k的博客

06-06

3158

其实第三方库pandas已经实现了这个功能, 但是为啥我还要自己重新写一个方法呢, 用过pandas你就会发现, 虽然可以去重, 但是最左边会莫名其妙多出一列序号, 好像这个去重方法还必须要传入去重列的字段名, 不能按列号去重, 最烦的是当对身份证号码去重时, 新生成的excel中身份证号码列竟变成了科学计数法....可能我是没有掌握pandas去重的要领吧, 算了, 自己动手造个轮子吧! 直接上代码: 简单解释一下, 同样需要引用openpyxl包, 这里我用了和pandas里一样的函

python如何将EXCEL表的数据去重复

小九啥也不会

06-24

1990

如果你想要根据某些特定的列进行去重，你可以传递一个包含列名的列表给drop_duplicates方法，例如：df.drop_duplicates(subset=[‘column1’, ‘column2’])。注意：在运行上述代码之前，请确保你的Python环境中已经安装了pandas和openpyxl库，并且example.xlsx文件在你的工作目录中，或者提供了正确的文件路径。（可选）将结果写回Excel文件：使用to_excel方法将去重后的DataFrame写回到一个新的Excel文件中。

【python】对excel数据进行去重

weixin_44557370的博客

08-09

905

然后我们可以看见文件里面包含一些重复的数据…

python脚本把execl去重

鲨鱼辣椒的博客

10-14

380

1、创建py文件 linux下 touch 1.py winodow下 type nul>1.py 2、编写脚本 import xlrd import xlwt a_set = set() wb = xlrd.open_workbook('D:\1.xlsx') sheet = wb.sheet_by_index(0) execl_copy = xlwt.Workbook() sheet1 = execl_copy.add_sheet('sheet1', cell_overwrite_ok=Tr

dataframe去重_关于python实现Excel大批量数据去重的方法

weixin_39611340的博客

11-27

338

关于python实现Excel大批量数据去重的方法当Excel数据量很大的时候，常规的编码方式效率非常低下。这个时候需要专业地大数据量处理方法进行去重处理。pandas是基于NumPy的一种工具，该工具是为了解决数据分析任务而创建的。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。需求：根据商品编号来判断行...

用python对excel文件去重

sunshinggg的博客

04-13

1297

用python对excel文件去重代码： import pandas as pd import numpy as np df = pd.read_csv(r’C:\Users\小天使\Desktop\data\prod_to_rules_quchong.csv’) df.sort_values(‘retro_templates’,ascending=False)#对文件按指定关键字进行排序 print(len(df)) a=df.drop_duplicates([“retro_templates”])#对

python对excel文档去重及求和

neo的博客

01-19

6292

废话不多说，估计只有我这个菜鸟废了2个小时才搞出来，主要是我想了太多方法来实现，最后都因为这因为那的原因失败了间接说明自己对可变与不可变类型的了解，还是不够透彻最后就用了个笨方法解决了快捷键coding:utf-8import xlrd import xlwt import os from collections import Counter workbook = xlrd.open

利用python 对excel进行整行去重、多列去重，保留最后出现值

ducanwang的博客

01-13

2668

利用python 对excel进行整行去重、多列去重，保留最后出现值

python 去除Excel中的重复行数据

dbva7063的博客

08-05

5437

导入pandasimport pandas as pd1.读取excel中的数据；frame = pd.DataFrame(pd.read_csv('excel的绝对路径.csv'’, 'Sheet1'))2.去除重复行后的数据;data = frame.drop_duplicates(subset=’’, keep='first', inplace=’’)drop_duplicates...

使用Python对Excel文件进行去重处理