
hive
Stefanboy
工作 技术 java 分享
展开
-
Hive优化(调优总结)
一、查看执行计划 explain extended hql;可以看到扫描数据的hdfs路径 二、hive表优化 分区(不同文件夹): 动态分区开启: set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nonstrict; 默认值:strict 描述:strict是避免全分区字段是动态的,必须有至少一...原创 2020-03-29 01:18:59 · 668 阅读 · 0 评论 -
Hive concat函数和concat_ws函数和concat_group函数&row_number over()和sum() over()&列转行,行转列
concat函数,concat_ws函数,concat_group函数 hivesql中的concat函数,concat_ws函数,concat_group函数之间的区别 CONCAT()函数 CONCAT()函数用于将多个字符串连接成一个字符串。 使用数据表Info作为示例,其中 SELECT id,name FROM info LIMIT 1;的返回结果为 ±—±-------+ | id ...原创 2020-01-03 12:13:04 · 8353 阅读 · 0 评论 -
Hive的排序和分区
Hive中的排序问题 order by 全局排序(慎用) 默认是升序asc,可指定降序desc。 order by是全局排序 只能有一个reduce作业来完成才能保证数据有序,这也是慎用的原因,数据太多容易导致计算 hive默认是非严格模式 hive.mapred.mode改为strict,则使用order by的时候有以下限制: 如果是普通表,则需要加 limit order by + lim...原创 2019-12-27 17:31:55 · 908 阅读 · 0 评论 -
Hive的join&HiveServer2和beeline&复杂数据类型&Function函数
join操作 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nyvwvfj2-1576774851855)(/img/hive2/1.png)] [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ew2Dy6I3-1576774851857)(/img/hive1/2.png)] hive中有两张表,分别为emp和dept表 hive支持...原创 2019-12-20 00:56:51 · 474 阅读 · 0 评论 -
Hive DDL&DML&DQL
Hive的DDL操作 创建数据库 语法 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_name=property_value, ...)]; 创建数据库,存储在HDFS...原创 2019-12-19 17:15:13 · 370 阅读 · 0 评论 -
Hive介绍&部署&配置&简单使用
Hadoop 狭义 Hadoop是最重要最基础的一个部分 广义 Hadoop生态圈,包括Hadoop、Hive、Sqoop、HBase… Hive概述 构建在Hadoop(HDFS/MapReduce/YARN)之上的数据仓库 Hive的数据是存放在HDFS之上 Hive底层执行引擎:MapReduce/Tez/Spark,只需要通过一个参数就能够切换底层的执行引擎,Hive作业提交到YARN...原创 2019-12-15 18:57:23 · 322 阅读 · 0 评论