背景:Tez union all时,识别不到subdir,count(*)=0
现象1:分组,组内排序错误,不同引擎执行结果不同。
现象2:select 🌟 有数据,select count(🌟) 为0。而且偶尔 是0,偶尔不是0。所以可能有些节点的配置和其他节点不同导致的。
主要配置是,要不要识别sub dir子文件夹。
原因:Tez union all时,HDFS文件是有 union sub dir 1、2等等。不同配置设置,结果将会不同。
不要使用select count(✨)判断,而是使用select ✨ 判断数据条数是否为空,而且尽量不要做出union all的表