hive表格统计信息不准确

问题描述

有个hive分区表,orc存储格式,有个分区,查询 select count(1) from table where dt='yyyyMMdd' 结果是0, 但查询 select * from table where dt='yyyyMMdd'又能查到数据,去hdfs对应目录下查看,也能看到有数据文件

解决

执行如下sql

ANALYZE TABLE db.table1 PARTITION(dt='20240908') COMPUTE STATISTICS

然后,重新查询count(1),结果恢复正确

参考

https://blog.51cto.com/u_16213353/7719891
https://imperio-wxm.github.io/2019/02/21/Hive-Table-Statistics/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值