
HIVE
文章平均质量分 84
且听_风吟
你还年轻,去爱去恨去相信,去追去梦去后悔。生命就该浪费在美好的事物上,还有资本,别怕失败。
展开
-
hive关系运算实例详解
非常详细的hive关系运算解析,并且每个运算都结合实例进行解释。原创 2020-05-20 19:28:20 · 1246 阅读 · 0 评论 -
hive行转列、列转行真题解析
本文目录一、行转列1.1、行转列需要用到的函数1.2、真题实战1.2.1、需求1.2.2、创建hive表并导入数据1.2.3、按需求解题二、列转行2.1、列转行需要用到的函数2.2、真题实战2.2.1 、需求2.2.2、创建hive表并导入数据2.2.3、按需求解题2.2.4、详细解析上述sql三、总结一、行转列1.1、行转列需要用到的函数CONCAT(string A/col, str...原创 2020-03-31 16:31:06 · 2302 阅读 · 22 评论 -
hive乱码彻底解决方案全记录
hive乱码主要分为三种:一种是hive cli查询乱码,但是在ambari端查看正常;一种是导入汉字数据后,所有客户端方式查询都乱码;一种是hive cli查询没有乱码,但是通过jdbc或者hiveserver2查询出现了乱码。下面分别列出亲测可行的解决方案:第一种:hive cli查询乱码,但是在ambari端查看正常表现:在hive基础命令行下后查询时,中文出现乱码,但是am...原创 2020-03-31 15:03:09 · 8521 阅读 · 3 评论 -
一文彻底学会hive分桶表(实战详解)
本文目录一、分桶表概述1.1、什么是分桶表?1.2、分桶表和分区表有啥区别?二、分桶表实战2.1、创建一个分桶表2.2、准备数据2.3、向分桶表导入数据2.3.1、错误导入示范(引出分桶的本质)2.3.2、正确导入示范(引出分桶规则)2.4、分桶抽样三、总结3.1、分桶表的优点3.2、常用操作3.3、分桶表的实质及与分区表的区别一、分桶表概述1.1、什么是分桶表?分桶是将数据集分解成更容易管...原创 2020-03-30 19:05:58 · 14470 阅读 · 46 评论 -
hive面试题总结(2020最新版)
本文目录一、hive架构相关二、hive的特点三、内部表和外部表的区别?四、4个by的区别?五、介绍一下有哪些常用函数?5.1、行转列函数5.2、列转行函数5.3、Rank排名函数5.4、窗口函数(开窗函数)六、UDF、UDAF、UDTF相关面试题6.1、UDF、UDAF、UDTF的区别?6.2、怎么自定义UDF、UDAF、UDTF函数?七、hive怎么解决数据倾斜?八、hive优化相关面试题一...原创 2020-03-27 15:05:23 · 24013 阅读 · 33 评论 -
Hive常用窗口分析函数
数据:0: jdbc:hive2://localhost:10000> select * from t_access;+----------------+---------------------------------+-----------------------+--------------+--+| t_access.ip | t_access.url ...原创 2018-07-03 23:52:12 · 1233 阅读 · 0 评论 -
hive 行转列 列转行操作实例
一、行转列的使用1、问题hive如何将a b 1a b 2a b 3c d 4c d 5c d 6变为:a b 1,2,3c d 4,5,6 2、数据test.txta b 1a ...转载 2018-07-09 21:16:47 · 11808 阅读 · 4 评论 -
HIVE行转列和列转行
本文转载自博客:点击打开链接行转列select dt_month,valid_num,unvalid_num from test.test_xw_rowtocol数据如下转换要求:行转列需保留列名,如下图方式一:采用union all的形式select dt_month ,'valid_num' as type ,sum(valid_num) as num from te...转载 2018-07-09 21:12:51 · 3714 阅读 · 0 评论 -
Hive优化
本文转载自:点击打开链接hive常见优化方法总结1,使用关键字 EXPLAIN 或者 EXPLAIN EXRENDED ,在要执行的sql语句前面加关键字,不执行语句,可以用来查看语法树2,使用limit限制的调整,一般使用limit其实还是全表扫描,所以可以修改配置 <property> <name> hive.limit.optimize.enable</...转载 2018-07-09 00:59:05 · 579 阅读 · 0 评论 -
Hive知识点总结(四)
Hive知识点总结(一)(基本概念、运行方式、创建库表、数据读取、文件格式):点击查看Hive知识点总结(二)(数据类型及修改表定义):点击查看Hive知识点总结(三)(Hive查询语法):点击查看6、hive函数hive的所有函数手册:点击查看下面我们总结一些常用内置函数及如何自定义函数6.1、常用内置函数6.1.1、类型转换函数(cast)select cast("5" as int) fro...原创 2018-06-23 05:01:17 · 1034 阅读 · 0 评论 -
Hive知识点总结(三)
Hive知识点总结(一)(基本概念、运行方式、创建库表、数据读取、文件格式):点击查看Hive知识点总结(二)(数据类型及修改表定义):点击查看5、hive查询语法hive在1.2.0之前不支持“不等值”join,但在1.2.0后支持不等值join,只是语法必须按如下形式写:SELECT A.*,B.* from A,B WHERE A.ID>B.ID;基本查询语法跟标准sql基本一致;SE...原创 2018-06-23 03:37:43 · 465 阅读 · 0 评论 -
Hive知识点总结(二)
Hive知识点总结(一)地址:点击查看3、数据类型3.1、数字类型和java数字类型一样:TINYINT (1-byte signed integer, from -128 to 127)SMALLINT (2-byte signed integer, from -32,768 to 32,767)INT/INTEGER (4-byte signed integer, from -2,147,48...原创 2018-06-23 03:09:02 · 505 阅读 · 0 评论 -
Hive知识点总结(一)
众所周知实际开发过程中,Hive主要是通过其丰富的内置函数,便捷的类sql来处理经过MapReduce清洗后的数据,下面我们进行Hive的知识点总结。1、Hive使用方式方式1:学习时使用的最基本的简单查询: bin/hive //启动hivehive>select * from t_test; //进行简单使用方式2:作为服务启动并使用:bin/hiveserver2 -hivecon...原创 2018-06-23 03:06:44 · 1228 阅读 · 0 评论