天文数据时间序列检索方法:高效与创新的结合
1. 相关工作
1.1 天体对象的交叉匹配
在天文学研究中,天文学家常常需要不同时间段收集的观测数据,以获得天体随时间变化的时序视图。交叉匹配,即通过计算不同目录中对象的位置来找出相同的天体,是实现这一分析的基本步骤。然而,随着天文目录数量的惊人增长,逐对比较所有目录中的每个源是不切实际的。因此,人们提出了许多优化方法来加速交叉匹配过程。
分区和并行化功能被广泛用于加速交叉匹配。例如,Gray 等人提出了早期的交叉匹配方法 Zone,该方法将球形空间划分为等高带,并在相关区域进行交叉匹配。在此基础上,Wang 等人根据天体在区域和网格中的位置对其进行划分,并在 GPU 上实现索引。后来,Budavari、Lee 等人在多个 GPU 上应用区域索引。与 Zone 类似,Kunszt 等人提出的分层三角网格(HTM)和 Gorski 等人提出的分层等面积等纬度像素化(HEALPix)是两种广泛使用的空间索引,分别将球体划分为三角形和菱形单元格。
不过,这些方法主要集中于不同望远镜或波段生成的目录的交叉匹配,无法很好地满足持续生成的天文目录的需求。近年来,贝叶斯模型也被用于交叉匹配,主要用于解决位置不确定的问题。
此外,还有一些现成的工具提供交叉匹配功能,如 CDS - Xmatch、ARCHES 等。但这些网络应用的局限性在于用户无法实现完整的自动数据处理流程。例如,CDS - Xmatch 只有 500 MB 的磁盘空间可用于存储用户自己的数据,且如果计算时间超过 100 分钟,所有作业都会中止。其他应用如 TOPCAT、SIMBAD 等,互联网连接也是交叉匹配速度的限制因素。
超级会员免费看
订阅专栏 解锁全文
1513

被折叠的 条评论
为什么被折叠?



