论文名称:LISA: A Learned Index Structure for Spatial Data
推荐理由:在空间查询处理中,流行的索引R-tree可能会产生较大的存储消耗和较高的IO成本。受最近的学习型索引[Tim Kraska et al., 2018]工作用机器学习模型代替B-tree的启发,作者研究了一个针对空间数据的类比问题。作者提出了一种新型的空间数据的学习索引结构(Learned Index structure for Spatial data,简称LISA)。其核心思想是利用机器学习模型,通过几个步骤,在磁盘页中生成任意空间数据集的可搜索数据布局。具体来说,LISA由将空间键(点)映射成一维映射值的映射函数、将映射空间分割成碎片的学习碎片预测函数和将碎片组织成页面的一系列局部模型组成。在LISA的基础上,作者设计了一个范围查询算法,以及一个网格回归模型,以将KNN查询转化为范围查询。同时,作者还为LISA设计了处理数据更新的算法。大量的实验表明,LISA在查询的存储消耗和IO成本方面明显优于R-tree和其他替代方案。此外,LISA可以高效地处理数据的插入和删除。
论文链接:https://www.aminer.cn/pub/5ed384dd9fced0a24b6570a6
订阅了解更多论文信息,定制您的个人科研动态信息流:https://www.aminer.cn/user/notification
#论文# #AMiner#


流行的空间查询索引R-tree有较大存储消耗和高IO成本。作者受学习型索引启发,提出针对空间数据的学习索引结构LISA,它由映射函数、学习碎片预测函数和局部模型组成。还设计了范围查询、网格回归模型及数据更新算法,实验显示其优于R-tree,能高效处理数据插入删除。
2万+

被折叠的 条评论
为什么被折叠?



