- 博客(5)
- 收藏
- 关注
原创 Sketch调研
Count-Min SketchCM sketch是一种非常经典的sketch方法,后续有许多新的sketch都是在其基础上进行变换所得到,它最早是在《An improved data stream summary: the count-min sketch and its applications》中被提出。CM sketch的思路也比较简单:使用d个hash函数,每个hash函数的取值范围都在...
2018-03-26 19:58:35
5895
1
原创 Hilbert R-tree: An Improved R-tree Using Fractals
LHV本文是对On packing R-tree的一种补充,主要是在原先的Hilbert R-tree基础上提出了Largest Hilbert Value (LHV),即最大希尔伯特值对此原先的Hilbert R-tree结构有稍许变化:对于叶节点,基本保持不变,对于一个最多包含C条记录的叶节点,每个记录结构为 (R, obj_id)其中R为对应的MBR,对于二维数据可表示为一个四元组 (xlo...
2018-03-26 19:02:09
1382
原创 空间目标排序
空间目标排序的基本思想为:将多维(或高维)空间目标映射到一维(或低维)目标空间可以利用索引,将空间划分为若干子空间,为其编号,然后用一维线段连接空间填充曲线就采用了这样的思想,即使用一条连续的曲线遍历空间中的所有网格然而填充曲线的效果存在好坏,关键的问题在于如何保持目标间的空间临近关系例如上图的两种填充方式,若记左上角网格编号为1,从左往右依次增加编号,则1和5的网格在填充曲线上的顺序位置较远(相...
2018-03-26 19:01:58
1735
原创 R+树
考虑R树的性能,其中覆盖(coverage)和重叠(overlap)两个概念很重要,因为R树查询是根据给定区域与当前MBR是否有交叉来判断, 因此覆盖和重叠都应当尽量小覆盖小即MBR要小,最好刚好包围其中的数据点 (对于叶节点)或子MBR (对于非叶节点)重叠小即MBR之间最好不要有交叉,这样可以增大空间利用率,减少查询冲突对于R树,当查询区域W如下时比较不利:因此R+树是通过分裂矩形来减少彼此间...
2018-03-26 19:01:37
2031
原创 (1984 R树) r-trees: a dynamic index structure for spatial searching
B树B树是一棵多叉平衡树,基本思想类似于先找一个大的空间,再逐步缩小所要查找的空间,最终在一个自己设定的最小不可分空间内找出满足要求的解。一个实例图如下:例如从区间[3,99]中找79,先从根结点判断79>35,把区间缩小为[35,99],然后在子节点中判断65<79<87,把区间缩小为[65,87],最后在中间的叶节点[75,79]中遍历,得到79R树B树适用于一维数据,对于多...
2018-03-26 19:01:22
1719
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人