行星科学中的自动化表面映射与风暴映射探索
1. 自动化表面映射:以水星为例
1.1 数据降维与参数调整
在处理行星表面数据时,我们可以通过约束局部邻域的大小来调整对数据中局部或全局结构的敏感度。 n_neighbors 这个参数就起到了这样的作用,其值从 0(局部)到数据大小(全局)变化。较小的值会使关注点集中在非常局部的结构上,可能会忽略整体情况;而较大的值对应更大的邻域,可能会错过精细结构。最佳值的选择取决于特定的数据结构以及应用所需探测的范围(局部还是全局)。
另一个重要参数是 min_dist ,它调节点在低维表示中的聚集程度,规定了点之间允许的最小距离。较小的值会导致更密集的嵌入,而较大的值则会产生更稀疏的嵌入。
例如,在对水星数据的处理中,ICA(独立成分分析)权重系数的密度对图显示,数据流形是一个略不对称的 4D 云,大部分数据集中在中心。对于 UMAP(均匀流形近似和投影)在 ICA 权重系数上的密度图,我们选择了 n_neighbors = 4000 和 min_dist = 0.99 ,因为在这个特定应用中,局部结构在任何层面都不明显,重要的是低维表示的整体形状以及数据点之间的相对位置。使用 UMAP 进一步降低经 ICA 压缩后的数据集表示后,数据集的最终维度为 [55,399 × 2] 。
1.2 聚类分析
1.2.1 聚类目标
在完成数据降维后,我们的最终目标是识别具有相似光谱特性的表面区域,以便进行地质解释。这是因为地质表面通常可以分
超级会员免费看
订阅专栏 解锁全文

1023

被折叠的 条评论
为什么被折叠?



