数据仓库中的索引与模块化包装器/监视器设计
1. SJIH框架成本分析
SJIH(Structural Join Index Hierarchy)框架的总成本大致可分为存储成本、索引检索成本和索引维护成本。在创建(存储)和检索SJIH时,还会结合以查询为中心的信息(包括选择性)来确定前向和后向路径(超过2条路径)的选择。
SJIH基于类组合层次结构中的一级类对象构建,如Sales、Product、Customer和Date(Year)。由于Customer类可细分为Teenager类,SJIH现在涉及“is - a”关系以及类组合层次结构(CC hierarchies)。面向对象(O - O)系统在类及其子类之间提供的隐式链接,为复杂对象(Sales)与其组件对象(Customer)的特化(Teenager)之间提供了连接。SJIH可以利用“is - a”链接以及之前工作中已利用的CCH链接。
存储和检索成本涉及确定对象之间的最佳遍历路径。在这种情况下,需要遍历n条路径,其中一条为前向路径,另外(n - 1)条为反向路径。成本与连接索引的基数成正比。根据相关成本模型,以类Ci为根的SJI的基数计算公式为:n = ||Ci|| × MF(Ci),其中MF是乘法因子,一般计算公式为:MF(Ci) = Ki x OPi(f Ci - Cj x MF(Cj)) ,其中Cj是Ci的子类;Ki是一个常数,取决于根与其共享子类之间的共享程度/前向扇出;OPi是前向扇出值的最大值或乘积,具体取决于类之间的配对是受约束还是不受约束。
通过一个示例查询,结合启发式爬山算法,发现对于给定查询,最优的SJIH是涉及Sales(S)、Teenager(T)、Product(P)和Yea
超级会员免费看
订阅专栏 解锁全文
3854

被折叠的 条评论
为什么被折叠?



