我们来深入解析大数据数据仓库中两个极易混淆但至关重要的核心层级:DWD层(数据明细层) 和 DWS层(数据服务层)。
这两层是数据加工流水线上的关键环节,理解了它们的区别,就抓住了数据从原始细节到服务应用的升华过程。
核心概念与一句话总结
- DWD(Data Warehouse Detail, 数据明细层):“企业统一的、清洁的、标准化的明细数据层”。它基于ODS数据,经过清洗、整合、维度退化后,得到原子粒度的、高质量的明细数据。它的核心是 “数据质量”和“一致性”。
- DWS(Data Warehouse Service, 数据服务层):“面向主题的、轻度汇总的数据层”。它以维度(如用户、商品、地区)为视角,对DWD层的明细数据进行轻度聚合(如按天、按用户),形成一系列公共维度指标,为上层应用提供可复用的数据服务。它的核心是 “复用性”和“效率”。
详细对比:DWD层 vs DWS层
为了更清晰地理解,我们从多个维度进行对比:
| 维度 | DWD(数据明细层) | DWS(数据服务层) |
|---|---|---|
| 定位 | 企业统一事实细节层、数据质量治理层 | 公共维度汇总层、可复用数据服务层 |
| 数据粒度 | 原子粒度。每条数据代表一个不可再分的业务事件。例如:一条订单记录、一次点击记录。 | 轻度汇总粒度。每条数据代表一个维度在某时间段的聚合。例如:一个用户一天的总下单金额、一个商品一周的被浏览次数。 |
| 表设计 | 面向业务过程(如交易、日志)。通常是事实表和维度表。采用维度退化等技术生成宽表,减少关联。 |

最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



