input image:[1, 1, H, W],经过backbone net后为[1, 256, H/4, W/4]
heatmap_decoder用于检测出线段的heatmap
先看heatmap_decoder,它的结构如下
conv 3x3, s=1, p=1
pixelShuffel(2)
这个block出现2次,然后接一个conv 1x1
PixelShuffel起了重要的上采样及改变channel的作用。
backbone net出来的channel=256被两个pixelShuffel(2)变换后channel=16,再经过conv1x1,最终heatmap的channel为2,即黑白两通道,[1, 2, H, W]。
这个heatmap对dim=1求softmax, 只取channel=1通道,shape变换为[H, W]
现在已经得到了topk=300个的特征点[300, 2],线段的heatmap [H, W],现在要把它们结合起来检测图像中的线段。
1)heatmap refine<