数据库模型与数据类型详解
1. 数据库模型问题与解决方案
在审视特定的星型架构时,会发现一个极为明显的问题。BIDDER 维度表与 LISTING_BIDS 事实表进行了两次连接,分别作为拍卖失败的出价者(BIDDER_ID)和拍卖获胜的出价者(BUYER_ID)。这可能会让人考虑创建两个事实表,一个包含列表信息,另一个包含出价信息。不过,列表字段相对于出价来说是维度性的,但相对于记录数量来说又是事实性的,这就导致了 BIDDER 表和 LISTING_BIDS 表之间通过 BIDDER_ID 和 BUYER_ID 外键建立的两个链接结构十分糟糕。
将 LISTING_BIDS 表拆分为两个事实表,进而形成两个星型架构,这种方法存在问题。因为这样会产生一个列表表和一个出价表,其中会包含大量重复的列表信息,对于数据仓库而言,这是对存储空间的不可接受的过度使用。
更好的解决方案是保留现有的数据仓库数据库模型,并创建一个物化视图,将 LISTING_BIDS 事实记录汇总到列表级别。物化视图会创建数据的物理副本,这个副本是通过对一个或多个基础表进行查询生成的。它可以是事实表中所有记录的精确副本,也可以是一种汇总。例如,对事实表中的某些事实进行汇总,像按每个国家对事实值求和,在物化视图中为每个国家生成一条汇总记录。如果事实表包含五百万条记录,而只有 250 个国家,那么物化视图将只包含 250 条记录,这会极大地提高查询性能。
物化视图通常只在高端(昂贵)的关系型数据库引擎中可用。使用物化视图将事实拆分为列表和出价,会得到一个与特定示例类似的结构。创建物化视图会创建物理副本,最终还是会有一个列表副本和一个包含所有出价的列表副本,实际上仍然有两个类似表的结构,它们之间是
超级会员免费看
订阅专栏 解锁全文
6864

被折叠的 条评论
为什么被折叠?



