总述:这部分主要介绍数据挖掘的实现问题,重点关注数据的组织形式、系统框架、相关的设计和名词介绍。不会涉及到非常具体的应用项目,可以当做基础知识科普。
- 什么是数据仓库
- 联机事务处理系统(OLTP)和联机分析处理系统(OLAP)的区别有哪些
- 多维数据模型的建立
- 如何设计和构造数据仓库
- 三层数据仓库结构的案例
- 数据仓库后端工具应该提供的能力要在什么范围内
- 元数据存储库是什么
- OLAP服务器类型有哪些
- 数据仓库实现中的问题
- 数据仓库、OLAP、OLAM(OLAP挖掘)的关系
1.什么是数据仓库
答:数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。
2.联机事务处理系统(OLTP)和联机分析处理系统(OLAP)的区别有哪些
答:OLTP是面向顾客的,关注企业或部门内部当前数据,采用实体-联系数据模型和面向应用的数据库设计,强调并发控制和恢复机制;OLAP是面向市场的,关注的数据来自不同数据库的不同版本,数据量巨大,采用星形或雪花模型和面向主题的数据库设计,大部分是只读操作。
OLTP和OLAP最好不要共用数据库,因为OLTP强调事务处理面向业务,OLAP强调大数据量查询汇总面向市场,两者共享会互相降低对方的使用体验。
3.多维数据模型的建立
答:数据立方体运维从多维对数据建模和观察,由维和事实定义。一般来说,维是关于一个组织想要保存记录的透视图或实体。每个维都有一个表与之关联,称为维表。通常,多维数据模型围绕中心主题组织,主题用事实表示,事实是数值的度量。事实表包括事实的名称或度量,以及每个相关维表的码。
最流行的数据仓库数据模型是多维模型,这种模型可以以星形模型、雪花形模型、事实星座模型的形式存在。星形模型是最常见的模型范例,其数据仓库包括:一个大的包含大批数据并且不含冗