Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training
当前的问题及概述:
大多数现有的方法高度依赖bounding box,然而,由于实际场景的限制,目前的检测模型往往产生不准确的bounding box,进而避免了算法的性能。
本文提出了一种新的由粗到细的金字塔模型,该模型不仅融合了局部信息和全局信息,而且还强化了局部信息和全局信息之间的线索,避免了bounding box的不准确性带来的影响。可以从下图看到,由于bounding box的遮挡问题,可以将图片进行不等分的划分,在下图从local到global的过程中,少量的局部视图(左)不能很好地匹配,而那些全局视图(右)有更多相似的线索。
模型及loss:
2.1Coarse-to-Fine Pyramidal Model :
首先由backbone提取输入图像的feature map(C×H×W),再将feature map按照空间高度轴分为n个部分(C×(H/n)×w),本文n=6,金子特最底层(l=1)为n个部分,最顶层(l=n)为feature map M&#x