
hive面试题
文章平均质量分 89
mr_cuber
这个作者很懒,什么都没留下…
展开
-
Hive面试题3:底层知识
目录 1.hive架构 什么是Hive Hive架构 Hive优点 Hive使用场景 Hive的执行流程 2.sql如何转为mapreduce程序的 1.hive架构 什么是Hive Hive是由Facebook开源用于解决海量结构化日志的数据统计;Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射 成一张表,并提供类SQL查询功能,底层计算引擎默认为Hadoop的MapReduce(本质是将sql转化成mapreduce程序),可以将引擎更换为Spark/T.转载 2021-02-02 00:29:57 · 316 阅读 · 0 评论 -
Hive面试题2:常用hive配置
目录 1.动态分区 1.启用动态分区原创 2021-01-28 00:55:43 · 1104 阅读 · 1 评论 -
Hive面试题1:复杂sql
1.等比例抽样 此场景在工作中遇到过,笔者原创。有用户表user,字段user_id, city。现运营同事要选10w人发调查问卷,要求人群的city分布,和全量用户的city分布一致。 with city_fenbu as ( select city, user_cnt/ sum(user_cnt) over() as zhanbi from ( select city,count(user_id) as user_cnt from user_inf原创 2021-01-25 01:21:14 · 1096 阅读 · 0 评论