第2章 数据仓库设计基础

本文介绍了数据仓库的三种常见模型:关系数据模型强调非冗余性、稳定性;多维模型如星型和雪花模式,易于理解和提高查询性能;Data Vault模型结合3NF和星型优点,追踪历史数据。数据集市作为数据仓库的简化形式,面向单一主题域,常采用维度模型设计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《Hadoop构建数据仓库实践》 作者:王雪迎

解读:小小兜

 

三种常见的数据仓库模型:

关系数据模型、多维数据模型和Data Vault模型

2.1 关系数据模型

关系数据模型的两组术语:“关系、属性、元组”和“表、列、行”。在这里它们的含义是相同的,只不过前者是关系数据模型的正式术语,而后者是常用的数据库术语。

在选择主键时,我们可以参考以下原则:

1.主键要尽可能地小。

2.主键值不应该被改变。主键会被其他表所引用。

3.主键通常使用数字类型。

4.主键应该是没有业务含义的,它不应包含实际的业务信息。无意义的数字列不需要修改,因此是主键的理想选择

5.虽然主键允许由多列组成,但应该使用尽可能少的列,最好是单列

主键所在的表被称为父表,外键所在的表被称为子表。

1.空值(NULL)

空值与数字零或者空字符串不同,零和空字符串是值,但空值代表没有值。因此,空值应该与其他值区别对待。空值具有特殊性,当它参与逻辑运算时,结果取决于真值表。

SQL语言又可分为DDL、DML、DCL、TCL四类:

DDL是Data Definition Language的缩写,意为数据定义语言,用于定义数据库结构和模式。典型的DDL有create、alter、drop、truncate、comment、rename等。

DML是Data Manipulation Language的缩写,意为数据操纵语言,用于检索、管理和维护数据库对象。典型的DML有select、insert、update、delete、merge、call、explain、lock等。

DCL是Data Control Language的缩写,意为数据控制语言,用于授予

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值