Hive count 函数的大坑!
select count(distinct member) from student t
如果member是string类型的,count计数的时候会吧null值单独计数为1,所有的分组统计都会这样计数,数量莫名的多出好多
表中member字段是string类型,空值是NULL,用is null 可以查出来,用=‘null’查不出来的那种。
这篇文章揭示了Hive中count(distinct member)函数在处理string类型member字段时遇到的问题,尤其是当遇到null值时,计数结果会错误地包含一个额外的计数。这对于统计分析可能导致误导,尤其是在数据清洗和预处理阶段。
Hive count 函数的大坑!
select count(distinct member) from student t
如果member是string类型的,count计数的时候会吧null值单独计数为1,所有的分组统计都会这样计数,数量莫名的多出好多
表中member字段是string类型,空值是NULL,用is null 可以查出来,用=‘null’查不出来的那种。
5331

被折叠的 条评论
为什么被折叠?