101-数仓建设方法论

前言:

设计理念

  • 范式建模:以关系数据库理论为基础,遵循范式规则,致力于消除数据冗余,确保数据的一致性和完整性,将现实世界的实体和关系以规范化的形式表示在数据库中。
  • 维度建模:以分析需求为导向,重点关注如何快速高效地支持数据分析和查询,将数据分为事实表和维度表,通过这种方式来组织数据,以方便用户从不同维度对事实数据进行分析。

数据结构

  • 范式建模:通常会产生较多的表,表与表之间通过外键关联,结构较为复杂。例如,在一个企业管理系统中,可能会将员工信息、部门信息、职位信息等分别设计为独立的表,通过外键来建立员工与部门、职位之间的关系。
  • 维度建模:主要由事实表和维度表组成。事实表存储业务过程的度量数据,如订单金额、销售数量等;维度表则包含用于分析事实数据的各种维度信息,如时间、地点、客户等。维度表围绕事实表分布,形成星型或雪花型结构。

应用场景

  • 范式建模:适用于联机事务处理(OLTP)系统,如银行核心业务系统、企业资源规划(ERP)系统等,这些系统需要频繁进行数据的增、删、改操作,要求数据具有高度的一致性和完整性。
  • 维度建模:主要应用于联机分析处理(OLAP)系统和数据仓库,用于支持复杂的数据分析和决策支持任务,如销售数据分析、市场趋势预测等,能够快速响应大规模的数据分析查询请求。

性能表现

  • 范式建模:由于表结构复杂,关联较多,在进行复杂的数据分析查询时,需要进行大量的表连接操作,可能导致查询性能较低。但在执行单表的增、删、改操作时,性能表现较好。
  • 维度建模:通过将数据按照事实表和维度表进行组织,减少了表连接的复杂度,在进行数据分析查询时,能够快速定位到所需数据,查询性能较高,尤其适合处理大规模的历史数据和复杂的分析查询。

结语

范式建模方便维护,但是数据构建周期长;

维度建模相对不方便维护,数据冗余大,但是数据构建周期短。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值