
hive
文章平均质量分 85
东纪元
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hive性能调优
1、fetch抓取(可配置,默认开启)简单的select筛选查询不启动mapreduce。。直接查2、小表与大表关联使用map join(默认开启),每个map task把小表数据全部下载到内存中,然后与大表分片数据进行关联。。避免在reducer端关联造成数据倾斜。3、大表与大表关联(1)空key处理:《1》当空key对应的行数据都是异常垃圾数据,那么在关联是先使用子查询...原创 2019-11-07 19:41:08 · 227 阅读 · 0 评论 -
hive 建表,分桶表(clustered by)、分桶且桶内排序(clustered by+sorted by)、分区表(partitioned by)、分区分桶一起用
一、分桶表1、建表语句create table test_bucket_sorted (id int comment 'ID', name string comment '名字')comment '测试分桶'clustered by(id) sorted by (id) into 4 bucketsROW FORMAT DELIMITED FIELDS TERMINATED ...原创 2019-10-31 20:21:48 · 21150 阅读 · 2 评论 -
Hive HQL语法大全
https://blog.youkuaiyun.com/qq_15300683/article/details/80455097转载 2019-08-24 21:30:42 · 255 阅读 · 0 评论