大数据--数据仓库--维度设计

本文详细介绍了维度设计在数据仓库中的重要性,包括维度的基本概念、设计方法和确定维度属性的原则。讨论了星型、雪花和星座三种模型的特性,强调了在维度建模中避免数据冗余和处理缓慢变化维的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

第二章:维度设计

2.1 维表层建设原则

2.1.1 维度的基本概念

2.1.2 维度的设计方法

2.1.3 确定维度属性

2.2 维度模型分类

2.2.1 星型模型

2.2.2 雪花模型

2.2.3 星座模型


第二章:维度设计

2.1 维表层建设原则

2.1.1 维度的基本概念

        维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实”,将环境描述为“维度”。维度是用于分析事实所需要的多样环境。例如,在分析交易过程中,可以通过买家,卖家,商品和时间等维度描述交易发生的环境。

        维度所包含的表示维度的列,称为维度属性。维度属性是查询约束条件,分组和报表标签生成的基本来源,是数据易用性的关键。维度使用主键标识其唯一性,主键也是确保与之相连的任何事实表之间存在引用完整性的基础。主键有两种:代理键和自然键,他们都是用于标识某维度的具体值。但代理键是不具有业务含义的键,一般用于处理缓慢变化维;自然键是具有业务含义的键。例如,商品id,对于前台应用系统来说,商品id是代理键;而对于数据仓库系统来说,商品id则属于自然键。

2.1.2 维度的设计方法

         对于维表层建设,我们有一些注意事项。

  • 维度表是用来描述事实,因此维度表的主键是与其关联的事实表的外键。

  • 维度表通常比较宽,是扁平的3NF,信息冗余并且包含大量的低粒度的文本属性

  • 避免维度表中属性有null值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值