数据仓库建模基本理论
数仓建模的目标
访问性能:能够快速查询所需的数据,减少数据I/O
数据成本:减少不必要的数据冗余,实现计算结果数据复用,降低大数据系统中的存储成本和计算成本
使用效率:改善用户应用体验,提高使用数据的效率
数据质量:改善数据统计口径的不一致性,减少数据计算错误 的可能性,提供高质量的、一致的数据访问平台
一、ER实体模型
在信息系统中,将事物抽象成“实体”、“属性”、“关系”来表示数据关联和事物描述。
实体:Entity
关系:Relationship
这种对数据的抽象模型通常被称之为ER实体关系模型
实体:通常为参与到过程中的主体,客观存在的,比如商 品、仓库、货位、汽车
属性:对主体的描述、修饰即为属性,比如商品的属性有商品名称、颜色、尺寸、重量、产地等
关系:现实的物理事件是依附于实体的,比如商品入库事件,依附实体商品、货位,就会有“库存”的属性产生;用户购买商品,依附实体用户、商品,就会有“购买数量”“金额”的属性产品。
有一对多、多对多、一对一的关系
ER实体关系模型也称作E-R关系图
“实体”用矩形表示:
“关系”用菱形表示:
“属性”用椭圆形表示:
建模步骤
- 抽象出实体
- 梳理实体之间的关系
- 梳理实体属性、关系属性
- 构建ER图
案例:
场景:课程管理系统
该系统主要用来管理某校教师、学生、课程,其中包括课程选修、考试、教师授课、学生班级管理功能,现需要完成数据库逻辑模型设计

最低0.47元/天 解锁文章
869

被折叠的 条评论
为什么被折叠?



