数据仓库

定义

数据仓库(DW)Data Warehouse,数据仓库是为企业级别的决策制定过程,提供所有类型数据支持的战略集合,他是单个数据存储,出于分析性报告和决策支持的目的而创建的,为需要业务智能的企业,提供指导业务、流程改进、监视时间、成本、质量以及控制。

特点

数据仓库之父“比尔·恩门”,在1991年出版的“Building the Data Warehouse”《建立数据仓库》中提出的定义——数据仓库DW,面场主题(Subject Oriented)、集成(Integrated)、相对稳定(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)

1、面向主题的
操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。
主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关

2、集成的
数据仓库的数据有来自于分散的操作型数据,将所需数据从原来数据中抽取出来,进行加工和集成,统一与综合后才能进入数据仓库。进行这一系列的数据处理,因事务型数据一般都是有噪声的、不完整的数据形式不统一的。“脏数据”的直接导入将对在数据仓库基础上进行的数据挖掘造成混乱。“脏数据”在进入数据仓库之前必须经过抽取、清洗、转换才能生成从面向事务转而面向主题的数据集合,消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息,数据集成是数据仓库建设中最重要,也是最为复杂的一步。

3、相对稳定
操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

4、反映历史变化
操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值