数据集市与探索式数据仓库:企业数据处理的关键组件
1. 数据集市的类型与特点
数据集市是从数据仓库中提取的定制化数据子集,每个部门可创建自己的数据集市,以满足其不断变化的业务需求。常见的数据集市有三种类型:
- 样本/子集/摘要型 :这是对数据仓库数据的简单抽样、子集提取或摘要呈现。
- MOLAP(多维在线分析处理)数据集市 :
- 数据以高度结构化的方式加载到数据集市中,并创建数据维度,典型维度包括产品、时间和地点等,通常维度数量有限,为四到六个。
- 维度创建后,数据可沿任意维度进行汇总,汇总完成后可在数据集市范围内进行钻取操作,从汇总数据深入到详细数据。
- 其本质是在数据加载后具有高度的灵活性和高性能,但为实现这种灵活结构,数据在进入多维数据集市前需进行高度不灵活的处理。
- ROLAP(关系型在线分析处理)数据集市 :
- 处理方式比 MOLAP 数据集市更通用,旨在使用成熟的关系型数据库管理系统(如 Oracle、Informix、Sybase 等)提供数据的多维视图,而 MOLAP 数据集市则使用专门的多维数据库管理系统技术。
- 数据进入 ROLAP 数据集市前的转换和准备工作量明显少于进入 MOLAP 数据集市的情况。
- MOLAP 数据集市常用于金融领域,因其业务维度简单、稳定,且对快速可预测的性能有需求;而 ROLAP 数据集市在营销、销售和服务等领域很受欢迎,这些领域愿意牺牲可预测的性能来换取管理和快速更改大量复杂维度的灵活性。
不同类型数据集市的特点对比表格如下:
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



