基于全卷积网络的SAR目标分类
文章目录
1. MSTAR数据集扩充
- 在原始SAR图像(128×128)中随机裁剪88×88大小的切片,每一张切片都能包含目标区域,经过随机采样样本数量可达(128-88+1)×(128-88+1)=1681 倍,每一个类别的每张SAR图像都采样10个切片,从而提高训练样本数量。
2. 全卷积网络模型(AConvNets)
- 网络完全由卷积层实现,去掉全连接层,最后一层卷积输出直接Softmax输出每个类别概率,损失函数依旧为分类交叉熵损失,具体网络模型如下:
- 其中卷积层使用BN层防止过拟合并加速训练,输入训练集维度:[b, 88, 88, 1] -> 输出:[b, 1, 1, 10],训练仍然采用的分类交叉熵损失,优化器Adam,学习率为0.0001。
3. SOC条件下分类结果
-
训练集和测试集如下:
类别 数量 训练集17° 测试集15° 2S1 299 274 BMP2 233 196 BRDM2 298 274 BTR60 256 195 BTR70 233 196 D7 299 274 T62 299 273 T72 232 196 ZIL131 299 274 ZSU23/4 299 274 总计 2747 2426 -
训练集每张SAR图像裁剪5个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共2747×6=16482 (张)。测试集中心裁剪88×88的切片。
-
训练:epoch = 50, Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:
-
计算测试集的混淆矩阵如下:
2S1 BMP2 BRDM B60 B70 D7 T62 T72 ZIL ZSU 2S1[[263 0 0 0 0 0 11 0 0 0] 95.99% BMP2[ 0 132 0 18 3 0 0 42 0 1] 67.35% BRDM[ 0 0 272 0 0 0 0 0 0 2] 99.27% B60 [ 0 0 0 192 0 0 0 0 1 2] 98.46% B70 [ 0 0 0 13 181 0 0 2 0 0] 92.35% D7 [ 2 0 0 0 0 272 0 0 0 0] 99.27% T62 [ 0 0 0 0 0 0 273 0 0 0] 100% T72 [ 0 0 0 1 0 0 0 195 0 0] 99.49% ZIL [ 0 0 0 0 0 4 0 0 270 0] 98.54% ZSU [ 0 0 0 0 0 0 0 0 0 274]] 100% 总计: 95.07% The Precision is : 0.9574354589252246 The Recall is : 0.9507109053615832 The Accuracy is : 0.9579554822753503 The F1 is : 0.9493873742571258 The F_beta is : 0.949223632328047 The Auc Score is : 0.9996171502953114
4. EOC1条件下分类结果
-
EOC1是大俯仰角变化条件下,其训练集和测试集如下:
类别 数量 数量 训练集17° 测试集30° 2S1 299 288 BRDM2 298 287 T72 299 288 ZSU234 299 288 总计 1195 1151 -
训练集每张SAR图像裁剪5个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共1195×6=7170 (张)。测试集中心裁剪88×88的切片。
-
训练:epoch200,Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-
-
计算测试集的混淆矩阵如下:
2S1 BRDM T72 ZSU 2S1 288 0 0 0 100% BRDM 0 287 0 0 100% T72 0 0 287 1 99.65% ZSU 59 0 0 229 79.51% 总计: 94.79% The CNN Precision is : 0.9564058388673098 The CNN Recall is : 0.9479166666666666 The CNN Accuracy is : 0.947871416159861 The CNN F1 is : 0.9473793419770824 The CNN F_beta is : 0.9465925313694183
5. EOC2条件下分类结果
-
EOC2是车辆外观配置变化,其训练集如下:
类别 数量(俯仰角17°) BMP2(9563) 233 BRDM2 298 BTR70(C71) 233 T72(132) 232 总计 995 -
测试集:
类别 型号 数量(俯仰角17° & 15°) T72 S7 419 T72 A32 572 T72 A62 573 T72 A63 573 T72 A64 573 总计 2710 -
训练集每张SAR图像裁剪10个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共995×11=10945(张)。测试集中心裁剪88×88的切片。
-
训练:epoch50,Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:
-
计算测试集的混淆矩阵如下:
BMP2 BRDM2 BTR70 T72 S7 8 0 0 411 98.09% A32 0 0 0 572 100% A62 1 0 0 572 99.83% A63 1 0 0 572 99.83% A64 4 0 0 569 96.14% 总计:98.78%
6. EOC3条件下分类结果
-
EOC3是针对同一目标的不同型号变种,训练集和EOC2训练集一致,测试集如下:
类别 型号 数量(俯仰角17° & 15°) BMP2 9566 428 BMP2 C21 429 T72 812 426 T72 A04 573 T72 A05 573 T72 A07 573 T72 A10 567 总计 3569 -
这里直接用EOC2训练好的模型进行预测,测试集的混淆矩阵如下:
BMP2 BRDM2 BTR70 T72 BMP9566 359 0 17 52 83.88% BMPC21 372 0 1 2 86.71% T72_812 2 0 1 423 99.30% T72_A04 3 0 0 570 99.48% T72_A05 1 0 0 572 99.83% T72_A07 0 0 0 573 100% T72_A10 20 0 0 547 96.47% 总计:95.74%