行星科学中的机器学习:图像标注与分类及修复技术
1. 行星图像数据集与标注
在行星科学研究中,图像数据是重要的信息来源。有一个行星体边缘和羽流数据集,它包含了 308 张美国国家航空航天局(NASA)拍摄的行星和卫星图像的手动标注数据。这些标注信息包括天体的边缘位置以及天体发出的羽流(如果有的话)。这里的“羽流”指的是从天体发出的明亮物质,比如土卫二的冰羽流或木卫一的火山羽流。在这 308 张标注图像中,有 112 张包含羽流。
2. 图像数据标注工具
创建新的标注图像数据集有多种选择。标注大量图像既耗时又耗力,而且行星科学图像的标注可能需要专业领域专家的判断。为了完成大规模数据集的标注,通常会采用众包的方式。以下是一些支持众包图像标注的工具和服务:
|工具名称|特点|费用|网址|
| ---- | ---- | ---- | ---- |
|Zooniverse|免费的网络平台,支持公民科学项目进行众包标注,提供可定制的用户界面,建立了研究人员和公民科学家之间的沟通渠道,但不提供自动接受或拒绝单个标注的功能|免费|https://www.zooniverse.org|
|Amazon Mechanical Turk (AMT)|付费的网络服务,提供按需、可扩展的人力来完成各种任务,包括图像标注。请求者可以为每个工作单元设定报酬,工人可以选择要完成的任务并获得报酬,还提供工具帮助选择优秀的工人|付费|https://www.mturk.com/|
|Yandex.Toloka|付费的网络平台,用于通过众包收集和处理大量数据。与 AMT 类似,提供工作市场,有全面的工具和可定制的模板来设计标注任务,并根据工人的过往表现和技能选择
超级会员免费看
订阅专栏 解锁全文
9508

被折叠的 条评论
为什么被折叠?



