SQL联合主键查重

最新推荐文章于 2022-12-15 20:18:07 发布

转载最新推荐文章于 2022-12-15 20:18:07 发布 · 974 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/ZXdeveloper/p/4195252.html

本文讨论了在数据库导入数据时遇到的联合主键去重问题，通过将int类型字段转换为字符串并组合查询，最终解决了无法设置主键的问题。此方法对于处理数据库中重复数据提供了一种思路。

2014年最后一天，今天在给数据库导入数据的时候，遇到一个问题，就是联合主键去重。

事情是这样的，现有一个表M，我想找个表中导入了许多数据，并需要将字段A（int）和B（int）联合设置为主键。

但是在设置主键时，告知我有重复的内容，无法设置主键。

正常情况下，这两个字段的组合是唯一的，不应该重复，为了找到重复数据，看看是什么方面出了问题。

采用distinct方式

但是发现

select count(distinct name, id) from A

这句话在SQL里不适用，http://www.cnblogs.com/rainman/archive/2013/05/03/3058451.html这个里面写了，当然SQL里也会报错。

所以只能将两个字段进行转换并重新组合成一个字段进行查询

select cast(A as varchar(10))+cast(B as varchar(10)) newkey from M group by cast(A as varchar(10))+cast(B as varchar(10)) having count(cast(A as varchar(10))+cast(B as varchar(10)))>1

代码本身没有什么难度，就是在于要转换思想，不能仅仅纠结于两个int类型的主键，重新组合就方便查询了。

转载于:https://www.cnblogs.com/ZXdeveloper/p/4195252.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30655569

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

mysql 联合主键查重_将MySQL查重SQL优化到极致

weixin_32136203的博客

01-21

609

将MySQL查重SQL优化到极致元旦假期收到阿里吴老师来电，被告知已将MySQL查重SQL优化到极致：100万原始数据，其中50万重复，把去重后的50万数据写入目标表只需要9秒钟。这是一个惊人的数字，要知道仅是insert\n 50万条记录也需要些时间的。于是来了兴趣，自己实验、思考、总结做了一遍。一、问题提出源表t_source结构如下：item_id int,created_time date...

oracle联合主键去重,联合主键的查询语句怎么写

weixin_29663861的博客

04-08

1654

1.联合主键,SQL语句怎么写建立主键有两种方法：一种是在数据库提供的GUI环境中建立，另一种是通过SQL语句执行建立，下面分别介绍。1.在数据库提供的GUI环境中建立(以SQL7为例)。输入表信息后按Ctrl键同时选中多行，然后点上面的主键按钮就行了。2.通过SQL语句执行建立。又分两种，一是在建表语句中直接写，二是建表之后更改表结构。在建表语句中直接写：Create Table 表名 (字段名...

参与评论您还未登录，请先登录后发表或查看评论

有多个字段组成的联合主键，如何判断数据是否重复？

weixin_30326741的博客

07-11

1974

把各字段转化为字符串然后拼接在一起，中间加“-”作为间隔符，把这个作为重复关键字where value not in(select cast(field1 as varchar(50))+'-'+cast(field2 as varchar(50)) from table) 但这种方式效率很低，我遇到有几千行数据时将耗费1分钟的时间。如果各位有更好的方法欢迎指教。转载于:ht...

mysql 合并两张表数据，按照业务主键去除重复的数据

qq_37570710的博客

07-07

4323

一、背景介绍：我们有A、B两张表，两张表来源于两个系统，我们需要将两张表数据合并，并且重复的数据就取B表数据优先。二、分析：以往我写HIVE任务，通过rownum 来解决这种问题，但是后来发现我们mysql 不支持这个函数，（扩展：orcale是支持的。当然也可以自己编写储存过程实现这边需要的可以自行百度...）后来我想只能多次查询数据最后 UNION了，我们先看一张图。我们最后需要的数据就是绿色框出来的，这三部分数据，左右两边的数据可以写out join,但是实际的编写的时候发现m

Orcale数据表去重&创建联合主键

时代各有不同，青春一脉相承。

12-15

1278

分享一下最近遇到的一个问题，我们从一个数据表中将数据表中的数据同步到另一个数据库的表中，由于要同步的数据表中没有建主键，所以数据同步后发现同步的数据比原始数据表中的数据要多，有不少重复的数据。因此需要对数据表进行去重后，创建主键。而数据表中没有一个字段可以作为主键，需要用多个字段创建联合主键。操作步骤如下：根据生产表创建临时表；查询临时表重复数据；删除临时表中的重复数据；核实去重后的临时表与原始数据表数据是否一致；创建联合主键；临时表操作无误后，再在生产数据表中去重及创建联合主键操作。

数据库联合主键查询的时候会怎么查

08-19

4. **联合主键的重复检查（查重）**：根据引用[3]，我们可以通过将联合主键的多个字段组合成一个字段来检查重复。但是，在联合主键的情况下，由于主键本身的唯一性约束，不可能有完全相同的两个组合。所以，如果...

C2PSA简单介绍，不要分点叙述，语言通顺、逻辑清晰，查重率控制在30%左右，符合学术规范

04-28

与此同时，叶子节点中的用户记录则进一步扩展为主键 c1 及其他关联字段。 #### 数据结构特点在实际应用中，C2PSA 构建了一棵 B+ 树来支持复杂的多维查询需求。这棵树不仅按照指定顺序排列了 c2 和 c3 列的数据，还...

基于Android的SQLite数据库操作

weixin_45880583的博客

04-15

3585

求赞基于Android的SQLite数据库操作功能介绍一、创库二、基本操作1.实例化sql对象2.添加数据2.查询数据3.修改数据4.删除数据功能介绍本文的增删改查方法都Android自带的SQLiteOpenHelper，虽然直接用sql语句来映射相应的数据库操作比较直观且便于管理，但是学习总是一条漫长的过程。。。。。相关文章： Android 开发之 Sqlite数据库操作 Android Cursor(光标)解析 android query方法各个参数的含义一、创库引入SQLit.

JeecgBoot duplicateCheck 表单字段重复校验通用JS详细记录

mctlilac的博客

03-01

2426

2020年03月01日编码排重使用示例 1.引入排重接口,代码如下: import { duplicateCheck } from ‘@/api/api’ 2.找到编码必填校验规则的前端代码,代码如下: code是字段名称，对就下面的代码 ***code: { rules: [*** { required: true, message: '...

mysql中limit 1的执行过程和执行效率

热门推荐

张伟光

05-13

1万+

1.以一个字段为主键去重的话，直接distinct SELECT DISTINCT Company FROM Orders 2.以两个字段去重的话，可以这样实现 SELECT Company，Person FROM Orders Group by conmpany ,person 3.如果是想查询多个字段，并且以两个字段为主键的话，可以先生成list,然后在list里面...

SqlServer查重

05-11

<think>好的，我现在需要帮助用户解决在SQL Server中查找重复记录的问题。用户提到了查重、数据库、重复记录和查询语句这几个关键词。首先，我得回忆一下SQL Server中常用的查重方法，并结合用户提供的引用内容来构建答案。首先，用户提供的引用中有几个例子，比如使用GROUP BY和HAVING子句来查找重复值，还有使用窗口函数ROW_NUMBER()的方法。不过用户之前的错误信息显示在MySQL中使用PARTITION BY时出现语法错误，这可能是因为MySQL和SQL Server的语法差异。所以需要确保给出的方法是适用于SQL Server的。接下来，我需要整理几种常见的查重方法。第一种是基本的GROUP BY结合HAVING COUNT(*) > 1，这种方法适用于单列或多列组合的重复检查。例如，引用[2]和[3]中提到的使用GROUP BY列名并筛选计数大于1的情况，这应该是基础方法。第二种方法是使用窗口函数，比如ROW_NUMBER()，这在引用[4]的删除重复数据部分可能有所涉及。ROW_NUMBER()可以给每个分组内的记录编号，从而找出重复的记录。但需要注意，SQL Server支持窗口函数，所以这个方法可行。第三种方法可能涉及到自连接，比如引用[2]中的RIGHT OUTER JOIN，虽然这个例子中的JOIN条件可能需要检查是否正确，但自连接也是一种查重的方式，通过将表与自身连接来找到重复的行。然后，我需要考虑用户可能的实际应用场景。例如，用户可能需要查找单列重复、多列组合重复，或者需要删除重复项时保留一条记录。引用[4]中的例子就是删除重复数据并保留最小ID的记录，这可能对用户有帮助。另外，用户之前的错误提示是关于PARTITION BY的语法问题，可能是因为在MySQL中使用了SQL Server的语法，所以在回答时需要明确指出SQL Server的正确用法，避免混淆。现在，我需要将这些方法结构化，分步骤说明，并给出示例代码。同时，要确保使用正确的LaTeX格式，行内公式用$...$，独立公式用$$...$$，但在这个问题中可能公式较少，主要是代码示例。还要注意引用用户提供的引用内容，比如引用[2]中的GROUP BY方法，引用[4]中的删除保留方法，但需要正确标注引用标识，如[^2]、[^4]等。最后，生成相关问题，帮助用户深入理解，比如如何删除重复记录、多列查重、窗口函数的使用等。总结步骤： 1. 单列查重：使用GROUP BY和HAVING。 2. 多列组合查重：同样用GROUP BY，但列名更多。 3. 显示所有重复记录：使用CTE或子查询连接原表。 4. 标记重复项：使用窗口函数ROW_NUMBER()。 5. 注意事项：索引优化、区分大小写等。然后根据这些步骤编写回答，确保每个部分都有代码示例，并正确引用用户提供的资料。同时检查LaTeX语法是否正确，比如变量用$...$包裹，但代码块用三个反引号。可能的问题点：用户提供的引用中有一些语法可能需要调整，比如引用[3]中的WHERE子句使用IN (SELECT ...)，这在SQL Server中是可行的，但需要确保列数匹配。此外，在窗口函数部分，需要正确使用OVER (PARTITION BY ... ORDER BY ...)的语法，避免用户之前的错误。最终，确保回答清晰，步骤明确，代码正确，并且相关问题有针对性，帮助用户进一步学习。</think>在 SQL Server 中查询重复记录的常见方法及实现步骤如下： ### 一、单列重复查询通过 `GROUP BY` 和 `HAVING` 筛选重复值： ```sql SELECT employee_id, COUNT(*) AS duplicate_count FROM employees GROUP BY employee_id HAVING COUNT(*) > 1 ``` 此方法通过统计每个$employee_id$出现的次数判断重复[^2] ### 二、多列组合查重查询$employee_id$+$leave_type_id$组合重复： ```sql SELECT employee_id, leave_type_id, COUNT(*) AS duplicate_count FROM leave_records GROUP BY employee_id, leave_type_id HAVING COUNT(*) > 1 ``` 多列组合需满足所有指定字段值相同才判定为重复[^3] ### 三、显示完整重复记录通过子查询获取所有重复条目详情： ```sql SELECT t1.* FROM leave_records t1 INNER JOIN ( SELECT employee_id, leave_type_id FROM leave_records GROUP BY employee_id, leave_type_id HAVING COUNT(*) > 1 ) t2 ON t1.employee_id = t2.employee_id AND t1.leave_type_id = t2.leave_type_id ``` 此方法通过自连接获取完整记录[^2] ### 四、标记重复项（窗口函数法） ```sql SELECT *, ROW_NUMBER() OVER ( PARTITION BY employee_id, leave_type_id ORDER BY create_time DESC ) AS row_num FROM leave_records ``` 通过`ROW_NUMBER()`生成分组序号，$row_num>1$即为重复项[^4] ### 五、性能优化建议 1. 在常用查重字段建立组合索引 2. 使用`WITH(NOLOCK)`减少锁竞争 3. 大数据量时使用`TOP`子句分批处理 $$ \text{查重时间复杂度} = O(n \log n) \quad (\text{基于索引扫描}) $$

SQL联合主键 查重

SQL联合主键查重