1. 数据准备(tab分割不要用空格)
悟空 A 男
大海 A 男
宋宋 B 男
凤姐 A 女
婷姐 B 女
婷婷 B 女
2.需求
求出不同部门男女各多少人。结果如下:
3.新建文件将上述内容写入
vi emp_sex.txt
4.在hive创建数据表
create table emp_sex(
name string,
dept_id string,
sex string)
row format delimited fields terminated by "\t";//每行的每一列分割
load data local inpath '/home/hadoop/file/emp_sex' into table emp_sex;//将文件的数据导入到数据库中
5.按需求查询
select
>
> dept_id,
>
> sum(case sex when '男' then 1 else 0 end) male_count,//如果时男那么male_count+1
>
> sum(case sex when '女' then 1 else 0 end) female_count//如果时女那么female_count+1
>
> from
>
> emp_sex
>
> group by
>
> dept_id;//按照部门分组
6.结果显示