概述-数据仓库是什么

本文探讨了数据库和数据仓库的区别,强调了两者的目的差异,数据库用于支持系统运作,而数据仓库则专注于数据分析和决策支持。随着技术的发展,数据仓库的特性如面向主题、集成、稳定和历史变化反映了其演进历程。然而,随着硬件和软件的进步,原有的数据仓库理论可能需要根据当前需求进行调整和优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据仓库是什么?

我以前一直把数据库和数据仓库弄混,因为我根本无法区别两者之间到底是什么差异,什么关系。尤其是中文名上几乎是相同的含义。
库不就是仓库吗?数据库不就是存放数据的仓库吗?那为什么数据库和数据仓库是两个东西呢?

数据库的英文是database,数据仓库的英文是data warehouse。都是国外传过来的,英文上差异还是不小的,至少不会弄混。
估计中文翻译database的时候讲求神似,翻译成了数据库,非常准确好理解。结果碰到data warehouse只能直译数据仓库了。

后来随着对这块的接触,慢慢理解了两者的差异。
数据库和数据仓库难以区分是正常的,因为我开始是按照形式的不同做得区分。
实际上这两者的形式可以完全一模一样。都可以使用MYSQL,都是库、表、字段、数据,甚至内容都可能一模一样(比如业务极简一年只做一天、数据量极少、不需加工处理的情况下)。

必须用目的来区分。
数据库的目的是支持各种系统正常工作用的,数据仓库的目的是为了对数据进行处理分析,为决策提供支持用的。

因为目的不同,数据库和数据仓库为了能更好的更有效率的达成目的,各自都基于不同的路径演化,形式上的差异也越来越大。
变成现在一说数据库,基本都是mysql,一说数据仓库,基本都是hdfs+hive。

数据仓库的面向主题、集成、相对稳定、反映历史变化的这些特点,不是天然存在的,而是为了更好的处理和分析数据,以能满足决策需要演化而来的。

一提数据仓库,必提Bill Inmon,他给数据仓库下了很多定义。
可我认为,这些定义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值