R++-树与关联规则聚类标签方法的研究
1. R++-树相关介绍
在空间数据处理中,R - 树、R∗ - 树和 R + - 树被设计为将每个节点存储在一个固定大小的磁盘页面上,它们具有相同的节点结构。对于对象 O,叶节点条目是一个元组 (p(O), oid(O)),其中 p(O) 是对象 O 的点,oid(O) 是对象 O 的标识符。内部节点也类似,每个内部节点保存有限数量的内部条目,每个内部条目指向一个子节点,内部条目是元组 (mbr(N), nid(N)),mbr(N) 是节点 N 的最小边界矩形,nid(N) 是节点 N 的标识符。
R - 树、R∗ - 树和 R + - 树的区别仅在于构建方式。R + - 树的搜索算法需要处理可能的重复项,因为一个对象可以存储在多个叶节点中。下面重点介绍 R++ - 树。
1.1 R++ - 树的设计
原始 R + - 树的缺点是子节点的矩形很少是最小的。由于每个节点的矩形必须完全被其子节点的矩形覆盖,所以不可能只存储最小边界矩形。使用最小边界矩形在添加新对象时会有问题,而较大的边界矩形会降低搜索效率。
R++ - 树为每个子节点保留两个矩形:一个用于搜索的最小矩形和一个用于插入新对象的较大矩形。用 br(N) 表示节点 N 的边界矩形(不一定是最小的),mbr(N) 表示节点的最小边界矩形。
R + - 树的内部节点 N 表示为:(nid(P), n, ((br(M1), nid(M1)), …, (br(Mn), nid(Mn))))。
R++ - 树的内部节点 N 表示为:(nid(P), n, ((mbr(M1), nid(M1)), …, (mbr(Mn)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



