大数据--数据仓库--数仓分层架构及建模原则

本文介绍了大数据数仓的分层架构,包括数据流向和建模原则。建模原则包括高内聚低耦合、核心模型与扩展模型分离等,强调一致性、命名清晰和性能成本的平衡。数据分层涉及事务型、存量型和复合型指标的定义与分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

1.3 数据分层架构

1.3.1分层架构示意图

1.3.2.数据 流向

1.3 建模原则

1.3.1 规范定义

1.3.2 建模原则


1.3 数据分层架构

1.3.1分层架构示意图

1.3.2.数据流向

 

1.3 建模原则

1.3.1 规范定义

    规范定义指以维度建模作为理论基础,构建总线矩阵,划分和定义数据域,业务过程,维度,度量、原子指标,修饰类型,修饰词,时间周期,派生指标。

1.现在对一些常用的名词术语进行解释

  • 数据域

        指向业务分析,将业务过程或者维度进行抽象的集合。 其中,业务过程可以概括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量的环境,如买家下单事件,买家是维度。为了保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护和更新的,但不轻易变动。在划分数据域时,既能涵盖当前所有业务需求,又能在新业务进入时无影响地被包含近已有的数据域中和扩展新的数据域。

  • 业务过程

        指企业的业务活动事件,如下单&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值