
hive
文章平均质量分 69
Brad_Q1
这个作者很懒,什么都没留下…
展开
-
hive中cube, grouping sets, grouping__id应用
hive 中grouping sets, grouping__id以及cube的具体应用及案例原创 2022-07-16 08:08:02 · 1099 阅读 · 0 评论 -
distribute by、 clustered by 、 order by 、 sort by 的区别
distribute by, order by, sort by, cluster by 的区别原创 2022-07-15 23:13:38 · 762 阅读 · 1 评论 -
Hive中数据倾斜解决实例
Hive中数据倾斜的表面原因可能各种各样,但是底层都是一个Reducer的节点计算压力过大,造成某一个节点一直在运算造成的。今天运行SQL的时候,遇到了一次,分享下(由于数据使用公司数据,表名都重新换过,数据量保持不变)表名信息如下,假设有两张表:tmp_user,数据量:267772tmp_user_log,数据量:5,617,310,131初始SQL如下: SELECT /*...原创 2019-02-18 19:17:34 · 789 阅读 · 0 评论 -
hive使用beeline连接遇到的问题
hiveserver2未启动如果hiveserver2未启动就直接使用beeline连接,会出现如下错误:Error: Could not open client transport with JDBC Uri: jdbc:hive2://master:10000/default: java.net.ConnectException: Connection refused (Connectio...原创 2019-03-24 09:17:25 · 8005 阅读 · 0 评论