
数据仓库基础学习
文章平均质量分 50
chenrizhong
自强,自立。
展开
-
数据仓库的数据质量
(一)数据质量的衡量标准、好处和问题 数据质量的好坏是决定一个数据仓库成功的关键,但是需要从那些方面衡量数据仓库中数据的质量呢? 可以从下列方面衡量系统中的数据质量: 准确性:存储在系统中的关于一个数据元素的值是这个数据元素的正确值 ;原创 2011-08-31 22:20:41 · 5683 阅读 · 0 评论 -
数据仓库体系结构
体系结构概念:将数据仓库的所有部分结合在一起的结构就是体系结构。数据仓库的不同部分组合在一起就组成了数据仓库的体系结构。体系结构主要目的:体系结构提供了开发和部署数据仓库的整体框架结构;它是一个全面的蓝图。体系结构定义了标准、衡量指标、通用设计和支持的技术。数据仓库的三个原创 2011-08-25 23:44:03 · 16309 阅读 · 1 评论 -
数据仓库的基础构造
基础构造是支持体系结构的基础。基础构造包括很多元素,首先,包括基本的计算机平台,这个平台包括所有需要的硬件和操作系统;其次是数据库管理系统;还有就是是数据仓库体系结构运转的人员和工作步骤也是。 基础构造元素可分为两类:操作型基础构造和物理基础构造。(一)操作原创 2011-08-28 10:31:10 · 1310 阅读 · 0 评论 -
数据仓库生命周期的一些疑惑
最近在学习 数据仓库相关知识,看了一些书籍,但是对关于数据仓库生命周期的一些描述好像有比较大的差别,也不知道是不是没有理解透彻。数据仓库生命周期与操作型系统不同这个都是一致的。在《数据仓库》一书中,“传统的S D L C是需求驱动的。为建立系统,你必须首先理解需求,然后进原创 2011-08-24 16:09:31 · 1744 阅读 · 0 评论 -
数据仓库开发各部分需要的需求定义
(一)数据设计阶段在数据设计阶段,必须为准备区和数据仓库存储库本身准备数据模型。准备区是在这里清洗、转换和整合从源系统得到的数据,并准备装入数据仓库。需求定义阶段用那些部分驱动数据设计呢?需要数据源系统的数据模型和信息包表两个基本部分。信息报表中的商业维度和关键衡量指原创 2011-08-24 23:48:13 · 1644 阅读 · 0 评论 -
数据仓库项目管理的一些原则和实施方法
数据仓库项目管理的一些主要原则包括:1、发起者的地位。如果没有强有力的管理者支持,数据仓库项目就无法成功。2、项目经理。项目经理应该更多的是面向用户和面向商业的,而绝对不能面向技术。 3、团队角色。团队的角色不能随意分配,这些角色必须反映出每一个独立数据仓库项目的需求原创 2011-08-22 18:54:42 · 1262 阅读 · 0 评论 -
数据仓库规划开始前的初步需求调查
数据仓库必须是以商业需求为驱动而不是以技术为驱动,这个是一个很明显的事情,但是在建设数据仓库的时候很多人都违背了上述规则,他们使用精深的技术来建设系统并以此来证明自己的技术是非常高超的。请紧记,数据仓库不是关于技术的,而是用来满足用户的战略信息需求的。所以,在进行所有的规划之前,原创 2011-08-21 19:45:51 · 1117 阅读 · 0 评论 -
规划数据仓库的关键问题
规划数据仓库应该从透彻的了解数据仓库的关键问题开始。关键问题的答案对于规划和成功完成数据仓库至关重要。 价值和期望首先,在企业文化和当前需求的背景下,确定数据仓库是最可行的解决方案;然后,在确定解决方案的是合适的之后,需要计算它带来的收益和价值。列出一个现实的价值和期原创 2011-08-21 18:06:06 · 915 阅读 · 0 评论 -
数据仓库的组成
数据仓库主要由下面几部分组成:源数据数据准备数据存储信息传递元数据管理和控制部分 源数据一般可分为4类:生产数据,一般来自与企业内部的各种操作型系统;内部数据,这些数据来自用户自己的电子文档、表格、客户信息,甚至部门内部的数据库;外原创 2011-08-21 01:39:06 · 5382 阅读 · 1 评论 -
数据仓库项目管理面试题整理
数据仓库项目管理面试题整理 搜了一下网络上都是一个主题一个网页,自己看了觉得不方便,所以整理到一起放上来方便自己看。原文出自Jerome的BI博客,网址是http://www.chinabi.net/blog/user1/lastwood/index.html转载 2011-08-20 18:37:09 · 4922 阅读 · 0 评论 -
数据仓库的定义和特点
先让我们看看数据仓库的定义,数据仓库的创始人 Bill Inmon 是这样定义的:数据仓库是 为支持决策管理建立的,是面向主题、集成的、稳定的、随时间变化的数据集合。 从数据仓库的定义可以看出数据仓库中数据的特点:(1)数据的存储是面向主题的:在操作型系统中,原创 2011-08-20 22:39:16 · 7983 阅读 · 0 评论 -
数据仓库和数据集市的鸡与蛋问题
数据仓库实现有两个基本的方法:(1)采用自上而下的方法,先建立数据仓库然后向各个数据集市提供数据;(2)采用自下而上的方法,几个部门的数据集市组成数据仓库。那现在的问题是建立数据仓库还是先建立数据集市? 两种方法各有优缺点如下:自上而下的优点是:1、从整个企业的业务原创 2011-08-20 23:42:46 · 1553 阅读 · 0 评论 -
为什么企业需要数据仓库
在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息。这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微。但是信息技术资源和操作型数原创 2011-08-20 12:42:52 · 2506 阅读 · 0 评论 -
数据仓库的部署
数据仓库的部署主要涉及用户培训、服务支持访问数据仓库的硬件和工具(一)部署的主要工作下图为数据仓库部署阶段的主要任务: (1)、完成用户认可 用户的认可在部署阶段不只是一个形式而是绝对必需的,在关键用户没有对数据仓库表示满意前不要强行进行部署原创 2011-09-02 12:22:11 · 3313 阅读 · 0 评论 -
数据仓库的物理设计
数据仓库的逻辑设计完成后,就需要根据逻辑模型开始进行物理设计。(一)物理设计过程:建立标准-->建立聚集计划-->确定数据分区方案-->建立聚簇选项-->准备索引策略-->安排存储结构-->完成物理建模。(二)物理设计考虑地因素 对数据库进行逻辑原创 2011-09-01 13:42:59 · 3934 阅读 · 0 评论 -
数据仓库的ETL抽取-转换-装载
ETL是数据仓库建设中一个最重要和具有挑战性的工作,也是一个耗时而且费劲的工作。数据抽取 数据仓库与操作型系统数据抽取的有一些:数据仓库必须从不同的系统中抽取数据;必须根据增量装载工作和初始完全装载的变化来抽取数据;而操作型系统只需要一次性抽取和数据转换。原创 2011-08-30 23:15:05 · 7142 阅读 · 0 评论