目标数据仓库结构设计全解析
在进行数据处理之前,我们需要先设计目标数据仓库的结构,明确其模样,之后才能将源数据映射到目标数据仓库中。下面我们来详细探讨数据仓库设计的相关内容。
数据仓库设计:维度模型的优势
在数据仓库设计方面,维度模型是最合理的选择。它从业务角度看待数据,让数据变得简单易懂,业务终端用户无需数据库管理员协助就能轻松查询数据。
之前我们看到的源数据库采用的是规范化建模方法。规范化模型通过将信息存储在不同的表中,并在需要时引用这些表来消除数据冗余。这种方法在事务处理系统中表现出色,因为信息只需在数据库的一处输入,避免了重复输入。例如,在ACME玩具和小工具事务数据库中,每次在收银机记录商品销售交易时,只需在交易表中添加一条记录,因为收银机、商品信息和处理交易的员工等信息已存储在其他单独的表中,主交易记录只需引用这些信息即可。
然而,规范化模型在数据仓库中并不适用,因为数据仓库的重点是从系统中提取数据,而用户不想在由众多表构成的规范化数据库模型中艰难导航以提取所需信息。因此,引入维度模型为终端用户提供了一种扁平化的、易于查询的表结构,从业务角度来看更易理解。
维度设计:以业务视角呈现数据
维度模型将组织的业务规则以更易理解的方式呈现在数据库中。业务经理查看销售数据时,自然会思考“上个月南方所有商店销售了多少小工具,与去年同月相比如何”等问题。他们只关心结果,不想为了得到结果而在复杂查询中连接多个表。维度模型消除了这种复杂性,以业务用户更容易理解的方式呈现数据。
用户可以直观地将上述问题的数据想象成一个立方体,立方体的边缘(即维度)标记为商店、产品和时间范围。下面我们来详细了解这个带维度的
超级会员免费看
订阅专栏 解锁全文
4917

被折叠的 条评论
为什么被折叠?



