一文理清概念:数据中台(DMP)-数据仓库(DW)-数据湖(DL)-湖仓一体-数据治理(DG)

理清数据中台、仓库、湖及湖仓一体概念

数据仓库、数据中台、数据湖、湖仓一体是数据管理和分析领域的重要概念,它们在功能、架构和应用场景上各有特点,同时也在演进中相互关联和补充。以下是对它们的定义和关系的详细解析:


1. 核心概念

(1)数据仓库(Data Warehouse, DW)
  • 定义
    一种面向主题的、集成的、稳定的数据存储系统,用于支持企业决策分析(如BI、报表)。数据通常经过ETL(抽取、转换、加载)处理,以结构化形式存储,采用Schema-on-Write模式(写入时定义结构)。

  • 特点

    • 数据高度结构化,适用于复杂查询和聚合分析。

    • 支持事务一致性(ACID)。

    • 典型技术:传统数仓(如Teradata)、云数仓(如Snowflake、Redshift)。

(2)数据湖(Data Lake)
  • 定义
    一个存储原始数据的存储库,支持结构化、半结构化、非结构化数据(如日志、图片、视频),采用Schema-on-Read模式(读取时定义结构),适合大数据处理和机器学习。

  • 特点

    • 低成本存储海量原始数据。

    • 灵活性高,但缺乏治理可能导致“数据沼泽”。

    • 典型技术:Hadoop、云对象存储(如AWS S3)、Delta Lake。

(3)数据中台(Data Middle Platform)
  • 定义
    一种企业级数据能力平台,强调数据资产化与服务化,通过统一的数据治理、开发工具和API,将数据快速转化为业务价值(如用户画像、实时推荐)。

  • 特点

    • 关注数据共享与复用,支撑前台业务敏捷创新。

    • 核心能力包括数据集成、开发、治理、服务化。

    • 典型代表:阿里数据中台。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值