大数据ODS与DWD层区别及应用场景

我们来深入探讨大数据数据仓库中另外两个非常核心的基础层级:ODS层(操作数据层)DWD层(数据明细层)

这两层是数据仓库的“地基”,理解了它们的区别,就能更好地把握数据从业务系统到可分析状态的整个加工过程。

核心概念与一句话总结

  • ODS(Operational Data Store, 操作数据层)“数据仓库的临时仓库和镜像库”。它的主要目的是贴源地存储从各个业务系统几乎无加工地同步过来的数据,与生产环境的数据结构基本一致。它是数据进入数据仓库的第一站。
  • DWD(Data Warehouse Detail, 数据明细层)“企业统一的、清洁的、标准化的明细数据层”。它对ODS层的数据进行清洗、标准化、整合、维度退化等一系列处理,得到一份干净、规范、统一的明细数据。它是数据仓库中质量最高的明细数据。

详细对比:ODS层 vs DWD层

维度 ODS(操作数据层) DWD(数据明细层)
定位 数据缓冲区、数据集成区 企业统一事实细节层、数据质量治理层
数据特点 原始数据、无加工或少量加工。可能存在脏数据(如 Null、异常值)、数据变化**(如 MySQL 的 update 操作)**。 清洁、标准化的数据。经过清洗、转换,数据质量高。通常是不可再变化的追加数据。
表设计 面向业务系统。表结构与源业务系统基本一致(同名、同字段、同类型)。可能存在多份不同业务的相同表(如多个系统的 user 表)。 面向主题/业务过程
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值