如何访问、处理和标记用于机器学习的PDS图像数据
1. 引言
机器学习方法在图像分析和分类问题上取得了新的进展,应用范围涵盖遗传学、材料科学、作物产量预测等多个领域。同时,人们对将这些方法应用于其他行星和天体图像以支持太空探索的兴趣也日益浓厚。然而,获取这些图像并非易事,而且它们通常以机器学习社区不熟悉的数据格式存储。本文旨在帮助机器学习项目利用超过700TB且仍在不断增长的NASA行星科学图像。
NASA行星科学任务收集的图像由行星数据系统(PDS)的制图与成像科学学科节点(成像节点)进行管理。目前,这些图像包含超过3400万个产品,涉及22个任务,目标包括月球、火星、水星、木星、土星、金星等。
PDS提供了数据搜索和检索工具,帮助用户查找和下载感兴趣的图像产品。同时,也有多种方法可将图像产品预处理成机器学习系统直接可用的图像格式。本文将介绍这些工具,并给出使用它们的详细步骤示例。为了训练机器学习分类器,通常需要为图像中的感兴趣概念或特征添加标签。本文也会提供一些建议和指导,以方便标记过程。最后,将介绍一个使用PDS图像数据的机器学习项目示例。
2. 访问PDS数据产品
PDS成像节点提供了用于浏览、搜索和下载行星任务图像数据的工具,具体如下:
- PDS图像图谱(PDS Image Atlas) :提供可视化浏览器,用户可根据图像元数据和/或内容应用过滤器,快速定位感兴趣的数据。其网址为:https://pds-imaging.jpl.nasa.gov/search 。
- PDS数据门户(PDS Data Portal) :可直接访问数
超级会员免费看
订阅专栏 解锁全文
1342

被折叠的 条评论
为什么被折叠?



