用distinct在MySQL中查询多条不重复记录值

本文介绍了一种在MySQL中实现查询某字段不重复记录的方法,利用COUNT(DISTINCT)结合GROUP BY,有效地解决了DISTINCT无法同时返回多个字段的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供有distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。其原因是distinct只能返回它的目标字段,而无法返回其它字段,这个问题让我困扰了很久,用distinct不能解决的话,我只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。所以我花了很多时间来研究这个问题,网上也查不到解决方案,期间把朋友拉来帮忙,结果是我们两人都郁闷了!


下面先来看看例子:


table

id name

1 a

2 b

3 c

4 c

5 b


库结构大概这样,这只是一个简单的例子,实际情况会复杂得多。


比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。


select distinct name from table

得到的结果是:


name

a

b

c


好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:


select distinct name, id from table


结果会是:


id name

1 a

2 b

3 c

4 c

5 b


distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除……


我们再改改查询语句:


select id, distinct name from table


很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件里?能,照样报错。。。。。。。


很麻烦吧?确实,费尽心思都没能解决这个问题。没办法,继续找人问。


拉住公司里一JAVA程序员,他给我演示了oracle里使用distinct之后,也没找到mysql里的解决方案,最后下班之前他建议我试试group by。


试了半天,也不行,最后在mysql手册里找到一个用法,用group_concat(distinct name)配合group by name实现了我所需要的功能,兴奋,天佑我也,赶快试试。


报错。。。。。。。。。。。。郁闷。。。。。。。连mysql手册也跟我过不去,先给了我希望,然后又把我推向失望,好狠哪。。。。


再仔细一查,group_concat函数是4.1支持,晕,我4.0的。没办法,升级,升完级一试,成功。。。。。。


终于搞定了,不过这样一来,又必须要求客户也升级了。


突然灵机一闪,既然可以使用group_concat函数,那其它函数能行吗?


赶紧用count函数一试,成功,我。。。。。。。想哭啊,费了这么多工夫。。。。。。。。原来就这么简单……


现在将完整语句放出:


select *, count(distinct name) from table group by name


结果:


id name count(distinct name)

1 a 1

2 b 1

3 c 1


最后一项是多余的,不用管就行了,目的达到。


唉,原来mysql这么笨,轻轻一下就把他骗过去了,郁闷也就我吧(对了,还有容容那家伙),现在拿出来希望大家不要被这问题折腾。


哦,对,再顺便说一句,group by 必须放在 order by 和 limit之前,不然会报错.

更郁闷的事情发生了,在准备提交时容容发现,有更简单的解决方法:


select id, name from table group by name


看来对mysql的了解还是太肤浅了,不怕被笑话,发出来让大家别犯同样的错误。转自:http://www.php100.com/html/webkaifa/database/Mysql/2008/0818/1118.html


### 使用 MySQLDISTINCT 关键字查询非重复数据 在 MySQL 中,`DISTINCT` 是一种用于返回唯一的关键字。它可以帮助开发者从查询结果中移除重复的数据行,从而只保留唯一的记录。 以下是通过 `DISTINCT` 实现查询非重复数据的一个具体示例: 假设有一个名为 `user_profile` 的表,其结构和部分数据如下所示[^4]: ```sql CREATE TABLE `user_profile` ( `id` int NOT NULL, `device_id` int NOT NULL, `gender` varchar(14) NOT NULL, `age` int , `university` varchar(32) NOT NULL, `province` varchar(32) NOT NULL ); INSERT INTO user_profile VALUES(1,2138,'male',21,'北京大学','BeiJing'); INSERT INTO user_profile VALUES(2,3214,'male',null,'复旦大学','Shanghai'); INSERT INTO user_profile VALUES(3,6543,'female',20,'北京大学','BeiJing'); INSERT INTO user_profile VALUES(4,2315,'female',23,'浙江大学','ZheJiang'); INSERT INTO user_profile VALUES(5,5432,'male',25,'山东大学','Shandong'); ``` 如果想获取该表中所有同的大学名称,则可以通过以下 SQL 查询实现: ```sql SELECT DISTINCT university FROM user_profile; ``` 此查询会返回一个仅包含独特大学名称的列表,即使某些大学可能有多个学生记录[^4]。 需要注意的是,当字段中有 `NULL` 时,`DISTINCT` 将把所有的 `NULL` 都视为相同的并只显示一次[^3]。 另外,在实际应用中,虽然 `DISTINCT` 能够有效减少冗余数据,但在大规模数据集中可能会降低查询效率。因此,应考虑索引优化或其他替代方案来提高性能[^1]。 ### 示例扩展:多列去重 除了单列外,也可以对多列组合使用 `DISTINCT` 来获得独特的记录组。例如,若希望找到每所大学及其所在省份的独特组合,可执行下面这条命令: ```sql SELECT DISTINCT university, province FROM user_profile; ``` #### 注意事项 尽管 `DISTINCT` 提供了一种简单的方式来消除重复项,但它并总是最佳选择。对于非常大的表格来说,它的计算成本较高,所以应当谨慎评估是否真的需要它或者是否存在更高效的解决方案[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值