基于图注意力网络的目标检测与分类及协作式电影制作平台研究
基于图注意力网络的目标检测与分类实验
在目标检测与分类领域,研究人员对算法在VOC数据集上进行了性能测试。
1. 实验设置
- 首先,使用两个数据集分别训练检测器。该检测器基于Faster R - CNN框架,采用预训练的VGG - 16作为骨干网络。训练参数遵循原始设置,使用随机梯度下降(SGD)进行80k次迭代,批量大小为1,初始学习率为10⁻³,在50k次迭代后降至10⁻⁴。
- 两个训练好的检测器负责生成具有位置置信度和目标密度的检测结果,这些结果作为非极大值抑制(NMS)训练和测试的数据集。检测结果会通过阈值为0.85的贪心非极大值抑制(Greedy - NMS)进行过滤,这种宽松的过滤旨在去除几乎相同的检测结果,其造成的影响几乎可以忽略不计。
- 所有结果以平均精度(AP)衡量,即召回 - 精度曲线下的面积,重叠阈值(用于将检测结果与目标匹配)传统上为0.5的交并比(IoU)。
2. VOC数据集上的目标检测
- 数据集选择 :VOC数据集包含20类标注对象,是计算机视觉领域早期的通用数据集。它包含VOC2007和VOC2012两个子集,其中VOC2012的测试集不公开。研究选择VOC2007和VOC2012的训练集和验证集作为训练集,共16551张图像,包含40058个对象;选择VOC2007的测试集作为测试集,包含4952张图像,12302个对象。上游检测和图注意力网络非极大值抑制(GAT - NMS)的训练和测试集相同。
- 检测生成与训练 </
超级会员免费看
订阅专栏 解锁全文
25

被折叠的 条评论
为什么被折叠?



