
Hive
文章平均质量分 93
Stray_Lambs
这个作者很懒,什么都没留下…
展开
-
数据仓库建模使用的模型以及分层介绍
星型模型星型模型是常用的维度建模方法。星型模型是以事实表为中心,所有的维度表直接连接在事实表上,像星星一样。星形模式的维度建模由一个事实表和一组维表成,且具有以下特点:维表只和事实表关联,维表之间没有关联; 每个维表主键为单列,且该主键放置在事实表中,作为两边连接的外键; 以事实表为核心,维表围绕核心呈星形分布。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,所以数据有一定的冗余。雪花型模型雪花模式(Snowflake Schema)是对星形模式的扩展。雪花模原创 2021-07-05 19:16:41 · 2234 阅读 · 0 评论 -
Hive 优化
Hive 优化1、Explain查看执行计划可以使用explain语句来查看HQL的执行计划,可以查看一共有几个阶段,有几个MR任务,有些类似于SQL。基本语法:EXPLAIN [EXTENDED | DEPENDENCY | AUTHORIZATION] query;这里放一段其他博主执行的explain语句STAGE PLANS: Stage: Stage-1 (包含了这个job的大部分处理过程,而且会触发一个 Mapreduce job) Map Redu...原创 2021-05-20 16:54:39 · 205 阅读 · 0 评论