↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale干货
作者:阿水,北京航空航天大学 ,Datawhale成员
摘要:数据竞赛对于大家理论实践和增加履历帮助比较大,但许多读者反馈不知道如何入门,本文以全国数字生态大赛为背景,梳理了cv数据竞赛的整个流程和改进思路。
继上一篇从0梳理1场数据挖掘赛事后。今天以天池正在进行的数字生态大赛为背景,对CV赛事的解题思路和上分技巧做了详细讲解。
这份Baseline不算复杂,用了1个小时,提交结果后比赛排名100/3171(Top 3%)
0.赛事背景
大赛名称:全国数字生态创新大赛-智能算法赛
大赛地址:
https://tianchi.aliyun.com/s/92ccdd364891b9e559a10e1df10079de(或文末阅读原文)
大赛类型:计算机视觉、语义分割
1. 赛题分析
赛题基于不同地形地貌的高分辨率遥感影像资料,要求参赛队伍利用遥感影像智能解译技术识别提取土地覆盖和利用类型,实现生态资产盘点、土地利用动态监测、水环境监测与评估、耕地数量与监测等应用。
地表类型(初赛)包括:
{
1: "耕地",
2: "林地",
3: "草地",
4: "道路",
5: "城镇建设用地",
6: "农村建设用地",
7: "工业用地",
8: "构筑物"
9: "水域"
10: "裸地"
}
2. 赛题数据
赛题设置
初赛:利用算法对遥感影像进行10大类地物要素分类,主要考察算法地物分类的准确性;复赛:利用AI算法对遥感影像进行10大类地物要素地物分类。同时考察算法地物分类的准确性及模型推理效率。
数据介绍
数据简介:数据为覆盖0.8m-2m分辨率的高分系列遥感多光谱影像,成像波段包括R、G、B、Nir波段,数据覆盖地貌包括:山地、丘陵地区、河湖(水库)、平原、城镇等等。感谢浙江大学环境与资源学院为本赛题提供数据支持。
数据规格:4万+张遥感影像及对应地物分类标记样本,影像大小为256*256像素。
-
初赛:16017张高分遥感影像和标注文件训练集,A榜测试集3000张测试数据,B榜测试集4366张测试数据。复赛:15904张高分遥感影像和标注文件,6000张测试数据。
训练测试数据说明:影像保存格式为tif文件,包括R、G、B、Nir四个波段,训练测试集影像尺寸均为256 * 256像素。标签数据格式为单通道的png。
评价标准
初赛指标
使用通用指标平均交并比mIoU,计算每个类别的交并比的平均值,仅对算法效果进行评价,具体计算公式为:
其中,

本文以全国数字生态创新大赛为例,详细梳理计算机视觉(CV)数据竞赛的流程,包括赛题背景、赛题分析、数据介绍、评价标准、建模方法和改进思路。通过构建语义分割模型,利用Unet等方法处理遥感影像的地物分类,针对类别不均衡和模型效率问题提出优化策略。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



