我们来深入探讨大数据数据仓库中另外两个非常核心的基础层级:ODS层(操作数据层) 和 DWD层(数据明细层)。
这两层是数据仓库的“地基”,理解了它们的区别,就能更好地把握数据从业务系统到可分析状态的整个加工过程。
核心概念与一句话总结
- ODS(Operational Data Store, 操作数据层):“数据仓库的临时仓库和镜像库”。它的主要目的是贴源地存储从各个业务系统几乎无加工地同步过来的数据,与生产环境的数据结构基本一致。它是数据进入数据仓库的第一站。
- DWD(Data Warehouse Detail, 数据明细层):“企业统一的、清洁的、标准化的明细数据层”。它对ODS层的数据进行清洗、标准化、整合、维度退化等一系列处理,得到一份干净、规范、统一的明细数据。它是数据仓库中质量最高的明细数据。
详细对比:ODS层 vs DWD层
| 维度 | ODS(操作数据层) | DWD(数据明细层) |
|---|---|---|
| 定位 | 数据缓冲区、数据集成区 | 企业统一事实细节层、数据质量治理层 |
| 数据特点 | 原始数据、无加工或少量加工。可能存在脏数据(如 Null、异常值)、数据变化**(如 MySQL 的 update 操作)**。 | 清洁、标准化的数据。经过清洗、转换,数据质量高。通常是不可再变化的追加数据。 |
| 表设计 | 面向业务系统。表结构与源业务系统基本一致(同名、同字段、同类型)。可能存在多份不同业务的相同表(如多个系统的 user 表)。 |
面向主题/业务过程 |

最低0.47元/天 解锁文章
1012

被折叠的 条评论
为什么被折叠?



