
数据仓库
文章平均质量分 64
Happybigman
如果好就拼命去努力,如果不好就随遇而安。
展开
-
数据仓库的两种建模方法(范式建模和维度建模)
数据仓库的两种建模方法范式建模 Inmon提出的集线器的自上而下(EDW-DM)的数据仓库架构。操作型或事务型系统的数据源,通过ETL抽取转换和加载到数据仓库的ODS层,然后通过ODS的数据建设原子数据的数据仓库EDW,EDW不是多维格式的,不方便上层应用做数据分析,所以需要通过汇总建设成多维格式的数据集市层。优势:易于维护,高度集成;劣势:结构死板,部署周期较长 范式建模应用在EDW层...原创 2020-03-20 15:45:57 · 10150 阅读 · 0 评论 -
第一、第二、第三范式之间的理解和比较
第一第二第三范式总结:第一范式属性不可分割(无重复的列)第二范式非主属性依赖主属性第三范式非主属性不存在传递依赖举例说明:实例讲解:第一范式如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF(即R符合第一范式)。两点:一、每个字段都只能存放单一值课程有两个值,不符合第一范式,可改为如下二、每笔记录都要能利用一个惟一的主键...原创 2018-08-29 17:01:34 · 5426 阅读 · 0 评论 -
Hive分析窗口函数 GROUPING SETS、GROUPING__ID、CUBE和ROLLUP
概述GROUPING SETS,GROUPING__ID,CUBE,ROLLUP这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小时、天、月的UV数。数据准备2015-03,2015-03-10,cookie12015-03,2015-03-10,cookie52015-03,2015-03-12,cookie72015-04,2...原创 2019-08-28 16:45:02 · 261 阅读 · 0 评论