数据仓库视图的质量与成本分析
在数据仓库的管理和维护中,视图的质量和成本是非常重要的考量因素。本文将围绕视图维护成本的计算、EVE 项目的介绍、E - SQL 查询语言的使用以及相关实验的评估等方面进行详细阐述。
1. 视图维护成本计算
在数据仓库中,对于单个数据更新,视图的总维护成本可以通过以下公式计算:
- 总 I/O 操作数($CF_{I/O}$):表示所有信息源(IS)的 I/O 操作总和,公式为 $CF_{I/O}=\sum_{i = 1}^{n}CF_{I/O}(IS_{i})$ 。
- 单个数据更新的视图总维护成本($Cost(V)$):$Cost(V)=C_{FM}\cdot Cost_{M}+C_{FT}\cdot Cost_{T}+CF_{I/O}\cdot Cost_{I/O}$ ,其中 $Cost_{M}$、$Cost_{T}$ 和 $Cost_{I/O}$ 分别是发送消息、传输数据块和执行磁盘 I/O 的单位价格。
- 为了对成本进行归一化处理,假设一个受影响的视图有 $k$ 个合法重写,合法重写 $V_{i}$ 的总成本可以通过以下公式归一化:$Cost^{*}(V_{i})=\frac{Cost(V_{i}) - \min_{1\leq j\leq k}(Cost(V_{j}))}{\max_{1\leq j\leq k}(Cost(V_{j})) - \min_{1\leq j\leq k}(Cost(V_{j}))}$ ,这样得到的视图维护成本在 0 到 1 之间,可以与视图质量进行权衡。
- 合法重写的整体效率($QC(V_{i})$):$QC(V_{i}) = 1-(Q_{quality}\cdot VV(V_{i}) +
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



