数据仓库整体介绍(第二篇)

本文介绍了数据仓库的分层架构,重点讲解了阿里的五层数据模型(ODS、DWD、DWB、DWS、DM/ADS),以及数据中台的三个层次。内容涵盖了数仓的建模模型、维度建模、实时数仓的特点,并提供了相关学习资源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一. 简介

1. 数仓分层架构

1.1 为什么要分层

  1. 清晰数据结构
  2. 方便数据血缘追踪
  3. 减少重复开发
  4. 把复杂问题简单化
  5. 屏蔽原始数据的异常

2. 数据中台3大层对应阿里5层数据模型

  1. ODS层 (Operation Data Store)

    1.1 数据来源
    (1)业务库
    离线数据:sqoop定时抽取日志
    实时数据:canal实时监听binlog 日志

    (2)埋点日志
    日志以文件形式存在:flume 定时抽取
    spark streaming /flink 实时抽取日志
    (3)消息队列
    active mq / kafka

  2. 数据仓库层 (Data warehouse)

    2.1 四个概念
    维度(dimension)/事实(fact)/指标(index)/粒度(granularity)

    2.2 DW分三层
    DWD,DWB,DWS
    (1) DWD data warehouse detail
    (2) D

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Freedom3568

技术域不存在英雄主义,不进则退

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值