《新兴数据湖仓设计与实践手册·数据湖仓建模及模型命名规范(2025年)》 由四篇递进式指南组成,以“模型架构—公共规范—分层规范—命名规范”为主线,系统构建可演进、可治理、可共享的现代数据湖仓。
首篇 《数据模型架构原则》 提出了 “ODS-DW-APP” 四层(含DW内DWD/DWM/DWS)数据分层架构,并围绕主题域划分、高内聚低耦合、公共逻辑下沉及成本性能平衡四大原则,为湖仓一体的维度建模奠定统一且可扩展的设计基石。
本文为系列文章第二篇,详细剖析了数仓公共设计所遵循的规范,包括层次调用规范、数据类型规范、字符串等数仓设计规范。
后续两篇将在此框架内,依次剖析数仓各层细化规范及统一命名体系,帮助企业用一套方法论完成从数据入湖到价值变现的全链路建设,敬请期待完整版。
1. 层次调用规范:把控数仓数据流向与引用原则
🚀业务数据流向设计与分层引用要点
稳定业务按照标准的数据流向进行设计,即 ODS –> DWD –> DWS –> APP。非稳定业务或探索性需求,可以遵循 ODS -> DWD -> APP 或者 ODS -> DWD -> DWM ->APP 两个模型数据流。
在保障了数据链路的合理性之后,也必须保证模型分层引用原则:
- 正常流向:ODS -> DWD -> DWM -> DWS -> APP,当出现 ODS -> DWD -> DWS -> APP 这种关系时,说明主题域未覆盖全。应将 DWD 数据落到 DWM 中,对于使用频度非常低的表允许 DWD -> DWS。
- 尽量避免出现 DWS 宽表中使用 DWD 又使用(该 DWD 所归属主题域)DWM 的表。
- 同一主题域内对于
数仓设计核心规范详解

最低0.47元/天 解锁文章
1381

被折叠的 条评论
为什么被折叠?



