Hive统计函数

本文详细介绍了SQL中的常用聚合函数,包括计数(count)、求和(sum)、平均(avg)、最大(max)和最小(min)等函数的作用及用法。此外还讲解了标准差(stddev)、方差(var)以及百分位数(percentile)等高级统计函数的应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(1)count(*) 作用:统计检索出的行的个数,包括NULL值的行
    count(t) 作用:返回指定字段的非空值的个数
    count(distinct t) 作用:返回指定字段的不同的非空值的个数

(2)sum(t) 作用:统计结果集中col的相加的结果
    sum(distinct t) 作用:统计结果中col不同值相加的结果

(3)avg(t) 作用:统计结果集中col的平均值
    avg(distinct t) 作用:统计结果中col不同值相加的平均值

(4)min(t) 作用:统计结果集中col字段的最小值
    max(t) 作用:统计结果集中col字段的最大值

(5)var_pop(col) 作用:统计结果集中col非空集合的总体变量(忽略null)
var_samp (col) 作用:统计结果集中col非空集合的样本变量(忽略null)

(6)stddev_pop(col) 作用:该函数计算总体标准偏离,并返回总体变量的平方根,其返回值与VAR_POP函数的平方根相同
    stddev_samp(col) 作用:该函数计算样本标准偏离

(7)percentile(BIGINT col, p) 作用:求准确的第pth个百分位数,p必须介于0和1之间,但是col字段目前只支持整数

(8)histogram_numeric(col, b) 作用:以b为基准计算col的直方图信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值