浅谈数据仓库

前言

写该篇文章有2个目的:
1、 输出倒逼输入,对工作学习做一个总结、查漏补缺
2、 帮助刚入行的同学建立对数仓的初步认识

一、 数仓是啥

要解释这个问题,首先先思考下"仓库"的含义。我们能够想到,仓库一般有一下几个特点:
1、 接受货物;
2、 存放货物;
3、 分发货物;
4、 。。。;

在这里插入图片描述

数仓的功能非常类似,核心也就是下面的功能:
1、 采集数据;
2、 存储数据;
3、 分发数据;
4、 。。。

在这里插入图片描述地方

这样一看,数仓其实跟实体仓库从本质上看没啥区别,不同点在于:
1、 仓库存储有形物品,无法复制;
2、 数仓存储数据,而数据是可以被复制的;
3、 仓库看得见、摸得着,而数仓你是看不到数据在硬盘中如何存储的,但是你能通过数据模型从逻辑上感受。

其实,它们之间还有很多类似,比如说在仓库会划分不同区域,按照货物种类统一存储,(超市也一个道理),
数据同样也会分类存储,同时仓库的货物流(入-存-发)与数仓的数据流也基本是一个意思,只不过某个货物运走了就没了,而数据是永远存在的。
这里只是借助这个例子,让大家能够将过往的生活经验代入进来,更快的理解什么是数仓,毕竟思想永远是相通的。

二、 为啥要数仓

有很多理由说服我们搭建数仓,但核心就一个:取数成本太高。
先解释一下:
取数:说明公司已经认识到数据中的价值
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值