简介:为什么空间索引有用?
在进行地理空间数据科学工作时,考虑优化您正在编写的代码非常重要。如何使具有数亿行的数据集更快地聚合或连接?这就是空间索引等概念的用武之地。在这篇文章中,我将讨论空间索引的实现方式、它的优点和局限性,并了解 Uber 的开源 H3 索引库,了解一些很酷的空间数据科学应用程序。让我们开始吧!
什么是空间索引?
常规索引是您可能会在书的末尾找到的那种东西:单词列表以及它们在文本中出现的位置。这可以帮助您快速查找特定文本中对您感兴趣的单词的任何引用。如果没有这个方便的工具,您将需要手动浏览书中的每一页,搜索您想要阅读的提及内容。
在现代数据库中,查询和搜索的这个问题也非常具有针对性。索引通常可以比过滤更快地查找数据,并且您可以根据感兴趣的列创建索引。特别是对于地理空间数据,工程师经常需要查看“交叉”或“附近”等操作。我们如何制作空间索引以使这些操作尽可能快?首先,让我们看一下一些地理空间数据:
假设我们想要运行一个查询来确定这两个形状是否相交。通过构造,空间数据库在包含几何图形的边界框之外创建索引:
为了回答这两个特征是否相交,数