hive
大道独行之BIGDATA
人生充满着期待,梦想连接着未来
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SQL万能模板之七步剖析--适合小白快速入门
SQL万能模板之七步剖析–适合小白快速入门 SQL模板 select 1 from 2 where 3 group by 4 having 5 order by 6 limit 7 1-决定了结果有哪些列:对数据源中数据列的过滤 2-决定了查询数据的数据源是什么 表、视图、join、子查询 3-决定了对数据源中数据行的过滤:分组前的行的过滤 4-决定了按照哪一列的值进行分组:一般都会搭配聚合函数 在group by语句中,1位置中的列要么是分组的字段,要是是聚合函数的结果 5-决定了对分原创 2020-12-02 11:36:11 · 3144 阅读 · 3 评论 -
hive优化基础1
1.hive优化基础1 开启分桶 set hive.enforce.bucketing=true; 设置reduce个数 set mapreduce.job.reduces=3; hive表 ->orc和parquet -->ZLIB或snappy Parquet是面向分析型业务的列式存储格式 fetch抓取: 在全局找、字段查找、limit查找等都不走mapreduce. set hive.fetch.task.conversion=more;默认为 none. 本地模式 : a.原创 2020-12-02 10:38:39 · 2180 阅读 · 0 评论
分享