数据仓库聚合技术:实现高效查询与灵活管理
1. 聚合基础与不可见性目标
在数据仓库的构建中,立方体和星型模式由于都是维度模型,具有天然的亲和力,这种组合是许多成功数据仓库实现的基础。聚合模式类似于数据库索引,它能占用额外空间来加快查询速度。理想情况下,聚合应像索引一样对用户不可见,即用户在编写查询时无需指定使用聚合,且聚合能随数据变化自动更新。但实际上,聚合通常需要在两方面加以关注:
- 编写或重写查询以利用聚合。
- 加载和维护聚合,使其与原始模式保持同步。
许多软件产品致力于实现聚合的不可见性,相关功能可能存在于报表工具、ETL 工具和数据库管理系统中。聚合的不可见性主要体现在两个方面:聚合导航和聚合生成,不同工具对这两个方面的处理方式有所不同,有些工具将它们紧密结合,有些则分开处理。
2. 聚合导航
聚合导航功能可消除查询编写者在基础星型模式和一个或多个聚合之间进行选择的困扰。它可以嵌入到架构的多个组件中,如报表工具、数据库或中间元素。其基本原理是,当合适时,聚合导航器会自动将查询重定向到聚合上,用户无需知道聚合的存在,也无需检查聚合是否适用于其查询。
例如,用户编写查询以获取 2009 年 1 月按产品划分的订单金额,在不知道聚合存在的情况下,用户编写了从基础订单事实星型模式中获取数据的 SQL 语句(“基础 SQL”):
SELECT
product,
sum (order_dollars)
FROM
day,
product,
order_facts
WHERE
day.mon
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



