1. 数据仓库的相关概念
OLAP
大部分数据库系统的主要任务是执行联机事务处理和查询处理,这种处理被称为OLTP(Online Transaction Processing, OLTP),面向的是顾客,诸如:办事员、DBA等。而数据仓库主要面向知识工人(如经理、主管等)提供数据分析处理,这种处理被称为OLAP(Online Analysis Processing)。OLTP管理的是当前数据,比较琐碎,很难用于做决策。而OLAP管理的是大量历史数据,提供汇总与聚集机制,并在不同的维度、不同的粒度存储和管理信息。
| 特征 | OLTP | OLAP |
|---|---|---|
| 面向 | 办事员、DBA | 知识工人 |
| DB设计 | 基于ER,面向应用 | 星形/雪花,面向主题 |
| 数据 | 当前的、确保更新 | 历史的、跨时间维护 |
| 视图 | 详细、一般关系 | 汇总的、多维的 |
本文介绍了数据仓库的概念,特别是OLAP、星形模式和Cube。详细阐述了Kylin中的Dimension类型,包括Normal、Mandatory、Hierarchy和Derived,并讨论了Measure的使用。通过实战示例展示了如何在Kylin中构建和查询Cube。
订阅专栏 解锁全文
723

被折叠的 条评论
为什么被折叠?



