天文与时间序列数据相似性搜索方法解析
1. 天文光谱数据处理与相似性模型验证
在天文光谱数据处理中,部分光谱存在大量噪声,这些噪声可能由测量的特定条件或额外的物理现象引起,且对当前的分类类型并非关键因素。曾尝试应用高斯平滑滤波器,该滤波器通过计算给定半径内相邻值的算术平均值来更新每个强度。然而,实验发现应用此滤波器会消除光谱中的重要信息,并且在大多数实验中对整体精度产生轻微的负面影响。
为了进行实验评估,使用了Ondřejov数据集。领域专家将光谱分为四个子类,以此作为验证相似性模型的基准事实。验证模型的具体步骤如下:
1. 迭代选择每个对象作为查询q。
2. 计算查询与除属于同一恒星的光谱外的所有剩余光谱之间的SQFD距离。
3. 使用这些距离对光谱按升序排序,创建列表S。
4. 在列表S中找到与查询属于同一类的第一个光谱s。
5. 将列表中先于s的所有光谱视为排序错误,并计算所有查询的这些错误的总和。
6. 将结果进行归一化处理,即除以光谱的总数。
不同方法的实验结果如下表所示:
| 方法 | 平均每个查询的误差 |
| ---- | ---- |
| simple | 不同取值 |
| intens | 不同取值 |
| gauss | 不同取值 |
| extreme | 不同取值 |
| extreme2 | 不同取值 |
从结果可以明显看出,所提出的方法实现了最低的错误率,且该结果的刻度是对数刻度。
mermaid图展示验证流程:
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



