HIVE
sinat_37333675
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive面试题
--建表create table login_table(user_id string,login_date string);--插入测试数据insert into login_table(user_id,login_date) values('001','20190301'),('001','20190302'),('001','20190304'),('001','20190305'),('001','20190306'),('002','201903原创 2020-12-11 17:20:55 · 311 阅读 · 0 评论 -
hive优化
小表join大表利用hive进行join连接操作,相较于MR有两种执行方案,一种为common join,另一种为map join ,map join是相对于common join的一种优化,省去shullfe和reduce的过程,大大的降低的作业运行的时间。common join:两个map作业读取两张表,归并为emp的格式,然后经由reducer合并。最后能获取到join的连接结果。map join:首先在本地生成一个local task 读取比较小的表,然后将表写入Hash Table File原创 2020-09-02 09:33:51 · 216 阅读 · 0 评论
分享