Excel 去除重复项的几种常用技巧

本文介绍在Excel中如何去除重复项的几种方法,包括使用【删除重复项】功能、高级筛选和公式等技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在工作中使用Excel时,经常会有需要在对原始记录清单进行整理时,剔除其中一些重复项。接下来本文就来讲解下Excel中去除重复项的几种常用技巧

所谓的重复项,通常是指在Excel中某些记录在各个字段中都有相同的内容(纵向称为字段,横向称为记录),例如下面图中的第三行数据记录和第五行数据记录就是完全相同的两条记录,除此以外还有第六行和第十行也是一组相同记录。

Excel 2010中去除重复项的几种常用技巧

在另外一些场景下,用户也许会希望找出并剔除某几个字段相同的但并不完全重复的“重复项”,例如下面图中的第7行记录和第12行记录中的【姓名】字段内容相同,但其他字段的内容则不完全相同。

Excel 2010中去除重复项的几种常用技巧

以上这两种重复项的类型有所不同,在剔除操作的实现上也略有区别,但本质上并无太大差别,可以互相借鉴参考。下面将以这两种场景为例,介绍几种常用的删除重复项操作技巧。

1、删除重复项

【删除重复项】功能是Excel 2007版本以后新增的功能,因此适用于Excel 2007及其后续版本。

将活动单元格定位在数据清单中,然后在功能区上依次单击【数据】——【删除重复项】,会出现【删除重复项】对话框。

对话框中会要求用户选择重复数据所在的列(字段)。假定我们将“重复项”定义为所有字段的内容都完全相同的记录,那么在这里就要把所有列都勾选上。而如果只是把某列相同的记录定义为重复项,例如文章开头所提到的第二种场景情况,那么只需要勾选那一列字段即可。

Excel 2010中去除重复项的几种常用技巧

在勾选所有列以后,单击【确定】按钮,就会自动得到删除重复项之后的数据清单,剔除的空白行会自动由下方的数据行填补,但不会影响数据表以外的其他区域。效果如下图所示:

Excel 2010中去除重复项的几种常用技巧

2、高级筛选

在2007版出现以前,【高级筛选】功能一直是删除重复项的利器。

将活动单元格定位在数据清单中,然后在功能区上依次单击【数据】——【高级】(2003版本中的操作路径是【数据】——【筛选】——【高级筛选】),会出现【高级筛选】对话框。

对话框中会要求用户指定列表区域,就是数据清单所在的单元格区域,默认情况下会自动生成。筛选方式上一般选择“将筛选结果复制到其他位置”,以方便删除重复项以后的处理操作。指定这种方式以后,对话框中会要求用户指定“复制到”哪里,也就是删除重复项以后的数据清单放置位置,用户指定其左上角单元格的位置即可,在这个例子中我们设定为E1单元格。最后一项也是删除重复项最关键的一个选项必须勾选:【选择不重复的记录】。如下图所示:

Excel 2010中去除重复项的几种常用技巧

单击【确定】按钮以后,就会在E1单元格开始的区域中生成剔除重复项以后的另一份数据清单,效果如下图所示:

Excel 2010中去除重复项的几种常用技巧

假定按照第二种场景的方式来定义重复项,就是需要删除所有【姓名】字段内容重复的记录,可以这样操作:

在数据清单中,选中【姓名】字段所在的区域A1:A12单元格,然后在功能区上依次单击【数据】——【高级】(2003版本中的操作路径是【数据】——【筛选】——【高级筛选】),会出现【高级筛选】对话框。筛选方式选择“在原有区域显示筛选结果”,【选择不重复的记录】复选框同样必须勾选,如下图所示:

Excel 2010中去除重复项的几种常用技巧

选择【在原有区域显示筛选结果】的方式,使得对A列不重复项的筛选结果能够同时影响到其他字段上。单击【确定】按钮后,筛选结果如下图所示。将这个筛选的结果复制粘贴出来,就等到一份剔除姓名字段重复项以后的新清单。需要补充的一点是,对于姓名字段相同的记录,这样的剔除操作过后,保留的是最先出现的记录。例如在第七行和第十二行两个“吴凡”之间,Excel保留的是最先出现的第七行记录,而剔除了后面的第十二行记录。

Excel 2010中去除重复项的几种常用技巧

3、使用公式

如果会一点函数公式,那么用函数公式配合筛选的方式来操作会更灵活多变一些,可以适应更多复杂条件。

在D列增加一个辅助公式,在D2单元格中输入公式:=A2&B2&C2,然后向下复制填充,生成的一列公式结果是将各条记录中的三个字段内容合并在一个单元格中。然后在E列再增加一个辅助公式,在E2单元格中输入公式:=COUNTIF(D2:D$12,D2),特别注意公式中绝对引用符号$的使用位置。将公式向下复制填充,得到下面图中所示的结果:

Excel 2010中去除重复项的几种常用技巧

COUNTIF函数的作用是统计某个区间内,与查询值相同的数据的个数,上面那个公式中的D2:D$12这种绝对引用和相对引用相组合的方式就可以在公式向下复制的过程中形成一个随位置变化的动态区域,使得COUNTIF函数每次都只跟自己下方的区域中的数据进行对比,而不会牵涉到上方的数据。因此在第三行的时候,会找到2条与“李明28研发部”相同的记录,而到了第五行的时候,就只找到了一条匹配记录。

通过这个公式结果可以发现,所有E列运算结果大于等于2的记录(如果有更多的重复,结果会大于2)就是我们需要剔除的重复项。这个时候,使用自动筛选功能,在E列筛选出大于1所在的行,然后删除整行,再恢复到非筛选状态,就能得到最后所需的清单,如下图所示:

Excel 2010中去除重复项的几种常用技巧

在上面的操作中之所以要将三个字段内容合并在一起,是因为我们在第一个场景中将“重复项”定义为所有字段内容都相同,因此将这三个字段的内容同时合并在一起进行比较,相当于逻辑运算中的”与“运算。假设需要按照第二场景中的定义来进行剔除操作,就不再需要D列这个过渡公式,而是可以直接以A列作为COUNTIF函数的对比区域,可以使用公式:=COUNTIF(A2:A$12,A2) 就可以实现相同的效果。需要补充说明的是,这个方法在剔除操作后,所保留下来的记录是重复记录中最晚出现的那条记录。

同样是第一场景,也可以用一个稍微复杂一些的公式来替代D、E两列的公式:=SUMPRODUCT(1*(A2&B2&C2=A2:A$12&B2:B$12&C2:C$12)) 公式的原理与前面相同。

Excel 中删除重复项是一个非常常见的操作,尤其当你需要清理数据集以避免冗余信息时。以下是几种常用的方法来删除工作表中的重复项: ### 方法一:使用“删除重复项”功能 这是最简单直观的方式之一,适用于大多数情况下的快速去重。 #### 步骤: 1. **选中你要检查的数据范围**(可以是一列或多列)。如果你不确定要选择哪些列,可以选择整个表格。 2. 切换到 **“数据”选项卡**。 3. 点击 **“删除重复项”按钮**。 4. 在弹出的对话框中,勾选你希望基于哪几列来进行比较和删除的操作。默认情况下会全选所包含的所有字段。(注意:Excel将保留首次出现的数据行,并移除所有后续相同的记录) 5. 单击 **“确定”** 按钮。完成后会有提示告诉你有多少条唯一值以及多少个重复项被删掉。 这种方法非常适合初学者或只是偶尔处理这类任务的人士使用。 --- ### 方法二:通过高级筛选去除重复项 对于某些特定场合下需要更精细控制的情况来说,“高级筛选”能提供更多的灵活性。 #### 步骤: 1. 同样先选定你的源数据区域。 2. 去到 **“数据”菜单栏** 下找到并点击 **“高级”命令**。 3. 在打开的新窗口里,在 “列表区域” 自动填充你应该已经选择了的目标区;如果没有则手动输入完整路径地址或者拖拽选取它。 4. 设置动作模式为 **仅复制过滤后的结果到其他位置**, 并指定一个新的空白处作为目标存放点。(如果不这么做将会直接覆盖原始资料) 5. 打开 **“选项... ”** 查看更多设置 -> 取消对 "只显示唯一记录" 的复选框标记 (这里是为了保证我们只获得非副本的内容); 6. 最终按下 OK 键执行指令后即可得到一份干净不含重复项目的副本。 这种方式的好处是可以不破坏原有数据库的同时生成一个净化过的版本供参考对比。 --- ### 方法三:利用辅助列配合公式法 当面对更为复杂的需求,比如在同一张表内既要保留下第一次出现的有效实例又得找出后来再次显现次数的信息量统计等特殊情形之下,我们可以借助新增加的一系列临时帮助性质栏目完成这项工作。 #### 示例流程演示: 假设我们要找寻A列中有无相匹配项目并且清除多余的拷贝同时保持最初一次遇见该元素不变: 1. 插入新列B命名为 `序号`, 输入以下数组公式然后向下拉伸直至涵盖整段待测序列: ```excel =IF(COUNTIF($A$2:A2,A2)=1,ROW()-1,"") ``` 2. 接着再添加另一辅助 C 列称作 `是否首现` ,在此填写判断语句如下: ```excel =IF(B2<>"", "是","否") ``` 3. 最后根据C列的结果进行排序升序排列并将所有标记不是初次亮相者隐藏起来或是物理上永久性地剔除它们就可以了! 这种技术虽然较为繁琐一点但是能够适应非常多变的要求调整方案十分强大。 --- ### 方法四:VBA宏程序自动化脚本 如果你熟悉 VBA 编程语言的话还可以编写自定义宏来做这件事儿。这对于经常遇到类似问题的专业人士而言无疑是最高效的途径。下面给出一段简单的代码例子用于批量清空某区间里的双胞胎们: ```vba Sub RemoveDuplicates() Dim rng As Range Set rng = Selection ' 或者你可以明确指出具体的工作簿名称与sheet页名及行列坐标 rng.RemoveDuplicates Columns:=Array(1), Header:=xlYes ' 修改Columns参数值以指明依据哪几列判定同质化个体,默认第一列为基准参照物,且视作标题不在范围内参与运算过程 End Sub ``` 只需按需修改相应变量声明部分就可以轻松应对不同场景的应用啦~ 以上就是关于如何在 Excel 中有效去除重复条目的四种基本技巧介绍。每一种都有各自的特点和适用范围,可以根据实际情况和个人偏好选择最适合自己的那一款哦!
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值