
Hive
桔梗的犬夜叉
这个作者很懒,什么都没留下…
展开
-
hivesql怎么排查是哪里出现了数据倾斜
转载下这位博主的文章,写的非常好,步骤非常清晰,学习一下。原创 2023-03-24 15:16:43 · 221 阅读 · 0 评论 -
org.apache.hadoop.hive.ql.exec.mr.MapRedTask. Could not find status of job:job_1649726530586_123811
hive sql在跑的时候可能会出现下面的问题:return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask. Could not find status of job:job_1649726530586_123811 (state=08S01,code=1)会报一个job名字长度超出限制的问题:解决方法: set hive.jobname.length=10;这里引用以为博主的例子,原文可以去这里查看hiv..原创 2022-05-28 16:19:36 · 1069 阅读 · 0 评论 -
hivesql的几种优化的方法
目前项目中由于数据量巨大,导致一个sql要跑一个多小时,所以找了些可以优化的点,记录下来,以后方便使用。1.map的优化,job在map task的过程时间较长set mapreduce.map.memory.mb=8240;set mapreduce.reduce.memory.mb=8240;set hive.merge.mapfiles=false;set mapreduce.input.fileinputformat.split.maxsize=50000000;set hive.e原创 2022-04-05 11:07:09 · 2902 阅读 · 0 评论 -
hive的sql优化方法[持续更新]
①列的裁剪,查询时只写我们需要的字段,提高效率②两张表关联时,可以把数据量小的表写在前面,大表写在后面,这样在加载时会把小表加载到内存中,减少资源占用。③原创 2021-06-03 17:38:02 · 228 阅读 · 0 评论 -
unix_timestamp()和 from_unixtime()的用法
hive中的unix_timestamp()和 from_unixtime()用法:unix_timestamp() 得到当前时间戳原创 2021-06-02 13:32:34 · 914 阅读 · 0 评论 -
hive建表语句
hive建表:内部表:#创建内部表create table LL_test (id int,name string,age int)row format delimited fields terminated by '\001'stored as textfile;外部表:#创建外部表create external table LL_test (id int,name string,age int)row format delimite原创 2021-04-14 15:56:49 · 194 阅读 · 0 评论 -
hive清空外部表的三种方式
本文为转载,原文链接:https://blog.youkuaiyun.com/lixiaoksi/article/details/106919895https://blog.youkuaiyun.com/elizabethxxy/article/details/108912884本文总结hive中清空外部表的三种方式hive版本:2.1.1环境准备新建一张外部表:create external table test_external(name String,age int,sex String) s..转载 2021-01-29 13:07:32 · 9918 阅读 · 0 评论 -
hive的UDF函数实现
hive的UDF函数的实现步骤:1.自定义一个实现类继承UDF,重写evaluate方法(自己想要实现的功能)2.把上面的类打成jar包上传到服务器以及hdfs中3.在使用hive语句时可以直接调用我们的方法即可参考博客:https://blog.youkuaiyun.com/zmywei_20160707/article/details/81698542...原创 2020-08-07 15:32:03 · 489 阅读 · 0 评论