68、数据仓库视图的质量与成本分析

数据仓库视图的质量与成本分析

在数据仓库的管理和维护中,视图的质量和成本是非常重要的考量因素。本文将围绕视图维护成本的计算、EVE 项目的介绍、E - SQL 查询语言的使用以及相关实验的评估等方面进行详细阐述。

1. 视图维护成本计算

在数据仓库中,对于单个数据更新,视图的总维护成本可以通过以下公式计算:
- 总 I/O 操作数($CF_{I/O}$):表示所有信息源(IS)的 I/O 操作总和,公式为 $CF_{I/O}=\sum_{i = 1}^{n}CF_{I/O}(IS_{i})$ 。
- 单个数据更新的视图总维护成本($Cost(V)$):$Cost(V)=C_{FM}\cdot Cost_{M}+C_{FT}\cdot Cost_{T}+CF_{I/O}\cdot Cost_{I/O}$ ,其中 $Cost_{M}$、$Cost_{T}$ 和 $Cost_{I/O}$ 分别是发送消息、传输数据块和执行磁盘 I/O 的单位价格。
- 为了对成本进行归一化处理,假设一个受影响的视图有 $k$ 个合法重写,合法重写 $V_{i}$ 的总成本可以通过以下公式归一化:$Cost^{*}(V_{i})=\frac{Cost(V_{i}) - \min_{1\leq j\leq k}(Cost(V_{j}))}{\max_{1\leq j\leq k}(Cost(V_{j})) - \min_{1\leq j\leq k}(Cost(V_{j}))}$ ,这样得到的视图维护成本在 0 到 1 之间,可以与视图质量进行权衡。
- 合法重写的整体效率($QC(V_{i})$):$QC(V_{i}) = 1-(Q_{quality}\cdot VV(V_{i}) +

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值