Excel重复行删除

 

Excel重复行删除方法:

Sub deleteP()
j = 10000
    For hang = 1 To j
        If Cells(hang, 1) = "" Then Exit Sub
        For i = hang + 1 To j
            If Cells(hang, 1).Value = Cells(i, 1).Value Then
               Rows(i).Select
              Selection.Delete Shift:=xlUp
               i = i - 1
           End If
        Next
    Next
End Sub

### 删除Excel文件中的重复 在Python中,可以通过`pandas`库轻松实现删除Excel文件中的重复的功能。以下是具体方法: #### 方法概述 通过`pandas`读取Excel文件的内容到DataFrame对象中,利用`drop_duplicates()`函数删除重复,最后将清理后的数据保存回Excel文件。 #### 实现代码 以下是一个完整的代码示例,展示如何使用`pandas`和`openpyxl`来删除Excel文件中的重复并保存结果[^1]: ```python import pandas as pd def remove_duplicates_from_excel(file_path, output_file_path): # 使用Pandas读取Excel文件 data = pd.read_excel(file_path) # 打印原始数据前几 print("原始数据:") print(data.head()) # 删除重复,默认基于所有列判断重复项 cleaned_data = data.drop_duplicates() # 打印去重后的数据前几 print("\n去重后的数据:") print(cleaned_data.head()) # 将清洗后的数据写回到新的Excel文件 cleaned_data.to_excel(output_file_path, index=False) print(f"\n已成功保存至 {output_file_path}") if __name__ == "__main__": input_file = "example.xlsx" # 输入文件路径 output_file = "cleaned_example.xlsx" # 输出文件路径 remove_duplicates_from_excel(input_file, output_file) ``` #### 参数说明 - `file_path`: 原始Excel文件的路径。 - `output_file_path`: 清理后保存的新Excel文件路径。 - `data.drop_duplicates()`: 默认情况下会基于所有列检测重复,并将其移除。如果仅希望针对某些特定列进去重,则可通过设置参数`subset`指定这些列[^1]。 例如,假设只想根据某一列(如`ID`)去除重复,可修改如下: ```python cleaned_data = data.drop_duplicates(subset=['ID']) ``` #### 注意事项 虽然`openpyxl`主要用于处理Excel文件的读写操作,但在本场景下主要依靠`pandas`完成数据分析与去重工作。因此无需额外调用`openpyxl`的具体功能[^2]。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值