文章目录
一、数据集构建
数字频高图是获取电离层实时信息最重要的途径。电离层结构检测对精准提取电离层关键参数,具有非常重要的研究意义。
利用中国科学院在海南、武汉、怀来获取的不同季节的 4311 张频高图建立数据集,使用 labelme 人工标注出 E 层、Es-c 层、Es-l 层、F1 层、F2 层、Spread F 层共 6 种结构。
1.1 数据集准备
下载数据后,放置在 MMYOLO 仓库的根目录下,使用 unzip test.zip 命令(linux)解压至当前文件夹。解压后的文件夹结构为:
Iono4311/
├── images
| ├── 20130401005200.png
| └── ...
└── labels
├── 20130401005200.json
└── ...
其中,images 目录下存放输入图片,labels 目录下存放使用 labelme 标注得到的 json 文件。
1.2 数据集格式转换
使用MMYOLO提供的 tools/dataset_converters/labelme2coco.py 脚本将 labelme 格式的标注文件转换为 COCO 格式的标注文件。
python tools/dataset_converters/labelme2coco.py --img-dir ./Iono4311/images \
--labels-dir ./Iono4311/labels \
--out ./Iono4311/annotations/annotations_all.json
1.3 浏览数据集
使用下面的命令可以将 COCO 的 label 在图片上进行显示,这一步可以验证刚刚转换是否有问题。
python tools/analysis_tools/browse_coco_json.py --img-dir ./Iono4311/images \
--ann-file ./Iono4311/annotations/annotations_all.json
1.4 划分训练集、验证集、测试集
设置 70% 的图片为训练集,15% 作为验证集,15% 为测试集。
python tools/misc/coco_split.py --json ./Iono4311/annotations/annotations_all.json \
--out-dir ./Iono4311/annotations \
--ratios 0.7 0.15 0.15 \
--shuffle \
--seed 14
划分后的文件夹结构: