SQL Server 2005数据挖掘与商业智能完全解决方案_笔记-第2章 构建简单的BI应用:福马特商业

本文介绍了数据仓库的设计过程,包括逻辑模型的构建,区分事实表与维度表,并讲述了如何定义数据源视图以及创建多维数据集和报表等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2.1.2  设计数据仓库逻辑模型

在数据仓库的逻辑结构中,数据表可以划分为两类:一类是事实数据表(简称为“事实表”),用来存储数据仓库中的实际数据,如这里存储1998年销售数据的sales_fact_1998表即为事实表;另一类是维度数据表(简称为“维度表”),用来存储数据仓库中的维度数据,如这里的关于时间、促销手段和产品等分析要素的表均为维度表。关于事实表和维度表的具体知识也在第3章学习。

注意,在本例中设计的维度表和事实表与原始数据中的表名及结构都一致,这主要是由原始数据的特点和本章作为入门章节的定位决定的。在实际设计的时候,通常需要根据需求情况重新建立与原始数据不同的表结构。这主要是由于传统业务的数据库是用来进行事务处理的(即OLTP),而数据仓库则是用来进行分析处理的(即OLAP),用途的不同决定了其结构的不同。这一点在以后复杂的数据仓库设计中会通过示例体现出来。

2.3.2  定义数据源视图

一般来说,事实表是没有主键的,而维度表都有主键,且每一个维度表的主键都是事实表的外键.

对每一个维度表设置好主键后,应该设置维度表和事实表之间的关系,方法是把事实表中的外键作为源,拖动到维度表中的相关字段,需要注意的是一定要把外键表作为源,主键表作为目标.

生成多维数据集可以暂时不用基于数据源,这实际代表了数据立方的两种创建方法。关于它们之间的区别和联系,将在第5章中讲解。

在所有维度的层次结构中,只有时间维度最为特殊。其他维度系统可以根据数据之间的关系检测其层次结构,而时间维度则需要指定其时间上的层次。

双击刚才创建的多维数据集,系统将会切换到多维数据集设计窗口,如图2-24所示的是该窗口的主要标签,它们标识了可以针对多维数据集进行的各种操作,包括添加各种商业智能功能和数据展示等。这些功能将在第5章中讲解。

  

图2-24  多维数据集设计界面的主要标签

2.4.1  创建报表

多维数据集的MDX代码

2.6.2  创建挖掘结构

提供了8种可用的挖掘算法,这些算法的具体细节将在第9章学习。




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值