
Hive
文章平均质量分 94
take off now
Boost
展开
-
构建数据仓库Hive(基于centos7系统)
文章目录简介1、slave2上安装mysql server(1)安装 EPEL 源(2)安装 MySQL server 包,下载源安装包(3)安装源(4)启动服务,重载所有修改过的配置文件(5)获取mysql初始密码(6)MySQL 密码安全策略(7)设置远程登录2、slave1 上安装 hive(1)创建工作路径,并将 hive 解压(2)修改/etc/profile 文件设置 hive 环境变量(master 和 slave1 都执行)(3)服务端和 Mysql 通信(4)回到 slave1,cd co原创 2021-02-04 18:29:06 · 506 阅读 · 0 评论 -
Hive hql语句 排序【全局排序、按别名排序、多个列排序、局部排序、分区排序】
文章目录1.全局排序案例实操:2.按照别名排序案例实操3.多个列排序案例实操4.每个MapReduce内部排序(Sort By)局部排序案例操作:(1)设置reduce个数(2)查看reduce个数(3)将查询结果按照成绩降序排列(4)将查询结果导入文件当中5.分区排序案例实操6.CLUSTER BY1.全局排序Order By :1.使用order by 子句排序:ASC(ascend):升序(默认)DESC(descend):降序2.order by 子句在select语句的结尾。原创 2020-12-19 17:23:09 · 4003 阅读 · 1 评论 -
Hive hql语句 group by 和 having
文章目录分组1.group by案例实操:2.havinghaving和where的区别:案例实操分组1.group bygroup by 语句通常会和聚合函数一起使用,按照莫格字段的内容j进行分组,然后每个分组进行聚合操作。案例实操:score表的数据然后我们使用hql语句:select s_id ,avg(s_score) from score group by s_id;以s_id作为分组条件,求得平均值,,结果如下:2.havinghaving和where的区别:1.w原创 2020-12-19 15:32:20 · 4274 阅读 · 1 评论 -
Hive hql语句 join 内连接 外连接 左连接 右连接
文章目录join语句别名1.内连接 inner join2.外连接3.左连接 && 右连接4.多表连接join语句hql中的join语句和sql中的语句相似,但是在Hive中只支持等值连接,不支持非等值连接。案例:select s.s_id,s.s_score,stu.s_name,stu.s_birth from score s join student stu on s.s_id = stu.s_id;如上命令 通过等值连接建立俩张表之间的关系,join使得俩张表进行原创 2020-12-19 14:54:54 · 2223 阅读 · 1 评论 -
Hive的内部表、外部表、分区表、分桶表
文章目录内部表和外部表的区别区别Hive分区表实现细节分区表综合练习(1)需求描述:(2)数据准备:(3)创建外部分区表,并且指定文件的存放位置(4)进行表的修复(建立表与数据文件之间的一个映射关系)Hive桶分桶表操作(1)开启Hive的分桶功能(2)设置Reduce个数(3)创建分桶表内部表和外部表的区别创建表时,如果没有使用external关键字,则该表是内部表(managed table)被external关键字修饰的是外部表(external table)区别内部表数据由Hive自身管原创 2020-12-15 14:37:00 · 2444 阅读 · 0 评论