
Hive
文章平均质量分 90
Hive相关
大数据技术架构
Focus on Lakehouse
展开
-
元数据管理 | Hive 元数据迁移与合并
在网易集团内部有大大小小几百套 hive 集群,为了满足网易猛犸大数据平台的元数据统一管理的需求,我们需要将多个分别独立的 hive 集群的元数据信息进行合并,但是不需要移动 HDFS 中...转载 2021-04-13 21:46:50 · 804 阅读 · 0 评论 -
大数据/数仓面试灵魂30问
1.什么是数据仓库?如何构建数据仓库?(如果这个问题回答的好,后面很多问题都不需要再问)2.如何建设数据中台?可简单说下理解与思路3.数据仓库、数据中台、数据湖的理解4.传统数仓的程度(...转载 2020-07-08 09:21:39 · 2141 阅读 · 0 评论 -
Hive 常见的数据倾斜及调优技巧
Hive在执行MapReduce任务时经常会碰到数据倾斜的问题,表现为一个或者几个reduce节点运行很慢,延长了整个任务完成的时间,这是由于某些key...原创 2020-03-19 08:12:39 · 1041 阅读 · 0 评论 -
Hive 调优,先掌握这几种优化模式
Hive和MapReduce中拥有较多在特定情况下优化的特性,如何利用好相关特性,是Hive性能调优的关键。本文就介绍那些耳熟但不能详的几种Hive优化...原创 2020-03-19 08:12:39 · 276 阅读 · 0 评论