COUNT DISTINCT 多个值比单个值小
背景:
现有一张表有a、b、c三个字段;
问题:
count(distinct c) = 10, count(distinct a,b,c) = 8;按常识来说不会出现这种情况。
原因:
当a、b、c中如果有一个值为null,那么count(distinct a,b,c)就会忽略这行记录,即使c的值不一样,但由于a或b为null,也会导致这行记录被排除,最终得到更少的数据。
解决方案:
如果想排除null的影响,可以使用一下方法:
select count(1) from(
select a,b,c
from table
group by a,b,c
) tmp