
BI
Jsoooo
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Kimball维度建模(事实表技术)
事实表: 1.就是现实中产生的可度量数值都存在一张表中,设计只与现实活动有关,与最终的报表无关。 并且事实表有很多外键与维度表相连 2.事实表中的数字度量分为三种,分别为可加,半可加,和不可加事实。最有用的是可加事实,可以以任意维度汇总。半可加就例如 差额,...原创 2019-07-10 15:51:40 · 971 阅读 · 0 评论 -
GreenPlum架构
GreenPlum总体架构:Master和Segment节点的功能: 其实每个Master和Segment都是一个单独的PostgreSQL数据库,都有自己的一套数据字典Master与Segment的关系: Segment有镜像来做数据备份(mirror),防止单机故障...原创 2019-07-11 17:21:27 · 157 阅读 · 0 评论 -
数据分析-维度表与事实表
一个典型的逻辑业务:如图有三个维度:市场、产品、日期那么三个维度之间的交点,即坐标轴中的交点就是一个事实,比如现实生活中的一个购买过程。事实表:是多个维度表的交点,反过来说事实表中一行存储了一个事实(业务), 还存储了维度表的主键维度表:分析事实表的其中一个维度,里面还包含了很多维度属性;用主键和事实表相连。结构如下图:...原创 2019-07-18 11:26:25 · 1704 阅读 · 0 评论 -
指标、维度与度量
何谓指标、维度、度量?先看这样一个指标:上海男性互联网从业人数如果是对数据敏感的分析师,立马就可以看出,数据中有三个维度。分别是:城市、性别、行业数据中的度量就是从业人数。一个数据指标一般由一种或多种维度加上一种度量组成。为何要维度和度量?从最终效果来看,维度和度量有助于我们发现问题真相,找到一些难以解释(异常)现象的原因。加入我们不从维度和度量下手,容易导致这些问...转载 2019-07-18 10:44:25 · 10915 阅读 · 2 评论 -
MPPDatabase(GreenPlum)和Hadoop
1.MPPDB: 1.基于MPP并行处理架构的数据库 2.Shared-nothing架构,各个节点之间互不干预,但一个节点崩了后就得等待重启才能访问该 节点里的数据 3.无master节点的扁平型架构 4.更擅长处理关系型数据 5.适合多维度自助分析、数据仓库、数据集市等。 6.存储的数据价值密度高2.Hadoop: 1.Had...原创 2019-07-11 16:58:10 · 1707 阅读 · 0 评论 -
PostgreSQL优势
PostgreSQL是一种非常先进的关系型数据库管理系统(ORDBMS),几乎是目前功能最强大、特性最丰富技术最先进的数据库系统。PostgreSQL支持绝大多数主流数据库特性:...原创 2019-07-11 16:18:34 · 1061 阅读 · 0 评论 -
OLAP与OLTP
数据库系统分为两种: 1.OLAP 联机分析处理,是基于数据仓库的信息分析处理过程,是跨部门、面向主题的。 2.OLTP(Online Transaction Processing) 联机事务处理,也称为生产系统,是面向应用的,例如淘宝网这种电子商务网站。OLTP特点:OLAP特点:...原创 2019-07-11 15:33:29 · 183 阅读 · 0 评论 -
企业数据仓库
1.数仓总线架构 总线架构中技术与数据库平台都是独立的,关系型数据库和OLAP维度结构都能参与其中。2.数仓总线矩阵 设计用来与总线架构交互的。 矩阵的列代表维度,行代表业务过程。点代表维度与给定的业务过程是否关联...原创 2019-07-10 17:13:15 · 271 阅读 · 0 评论 -
Kimball维度建模(维度表技术)
维度表: 1.每个维度表都包含单一的主键列,作为与事实表的外键 2.维度表有自己的维度代理键,即用来标识唯一性,无意义。+1 3.下钻 商业分析的基本方法: 上卷(roll-up):上卷是沿着维的层次向上聚集汇总数据。 例如,对产品销售数据,沿着时间维上卷,可以求出所有产品在所有地区每月 (或季度或年或全部)的销售额。 下探(dril...原创 2019-07-10 16:58:17 · 1382 阅读 · 0 评论 -
数据集市
数据集市通常只用于部门内部原创 2019-07-10 14:38:57 · 459 阅读 · 0 评论 -
Kimball维度建模(基础)
1.收集业务需求与数据实现2.协作维度建模探讨: 工作由建模者承担,但维度模型英语熟悉业务的业务代表探讨3.四步骤维度设计: 1.选择业务过程 业务过程是一系列操作活动,转换为事实表中的事实,例如每个月每个账单快照 2.声明粒度 粒度是指事实表中的一行代表什么。同一事实表不要混用粒度,最好从最小粒度开始设计维度, 因其能承受用户无法预知的查询...原创 2019-07-10 15:13:49 · 1540 阅读 · 0 评论 -
维度-实际销售模式
零售事实表每个列都包含POS事务号码POS看起来像维度键,但清空后会报错,因为维度是空的下面是维度模型和关联查询之间的关系原创 2019-07-17 17:11:52 · 189 阅读 · 0 评论