《Clustered Object Detection in Aerial Images》
原文链接:https://arxiv.org/abs/1904.08008v1
补充材料:https://www.researchgate.net/publication/335393286_ClusDet-supppdf
代码链接:https://github.com/fyangneil/Clustered-Object-Detection-in-Aerial-Image
一、针对什么问题?
1、问题:
航拍数据集VisDrone数据集中的难点:
1)小目标:难以和背景区分的行人等;
2)分布不均匀,部分区域稀疏,部分区域密集;
二、 提出什么方法?
提出ClusDet网络
1)CPNet : 作用:聚类候选框提取;优点:减少图像分区数量,提高效率。
2)ScaleNet: 作用:尺度估计; 优点:提高小目标检测精度。
3)DetecNet: 作用:检测聚类区域;优点:有效利用上下文信息。
三、三部分网络具体实现
1)聚类区域提取
a)CPNet: 简化版RPN,其中meanshift算法获得聚类候选框的GroudTruth。
b)ICM:合并聚类候选框,采用NMM,方法类似于NMS
2)调整聚类候选框
a)ScaleNet:,
,
,其中
为聚类候选框groundtruth的平均值,
为检测目标的参考尺度(好像并无具体计算方法)。
b)PP:聚类候选框中大于阈值的填充(舍弃),小于阈值的均等分;感觉文中的公式好像有点别扭
3)结果融合
采用NMS将聚类候选框的检测结果和原图的检测结果进行融合,进而得到最终的结果。