行人检测论文 -- ALFnet Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fit

论文名称:Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting

代码地址:https://github.com/liuwei16/ALFNet

     这是18年行人检测做的结果比较好的一篇论文,如果发现我有写的不对的地方,欢迎指出 .

     还是一篇行人检测,使用的是 anchor base 的方法,基本网络结构是SSD,引入了 Cascade Faster RCNN 的想法,在预选框生成的过程中,不断提高IOU最后在目标的附近得到更多的高质量预测框,从而提高检测效果。

    因为使用的是SSD,所以网络的速度很快,加入级联结构之后,进一步提升了精度。

一、 网络结构:

     前向的网络resnet50,取出其中下采样8,16,32的三层feature map,再补充一层下采样64的。原先的SSD是直接用这些采样得到的feature map 提出预选框。现在 ALFnet 在这些 Feature map 上使用了级联结构 CPB. 左边的图有点奇怪,直接看这图估计都不知道这个结构是怎么运行的,所以来看看代码:

def alf_pred(input,num_anchors,name,filters=256,kersize=(3,3),trainable=True):
    # the first layer modified from256 to 512
    x = Convolution2D(filters, kersize, padding='same', activation='relu',
                      kernel_initializer='glorot_normal', name=name + '_conv', trainable=trainable)(input)

    x_class = Convolution2D(num_anchors, (1, 1),activation='sigmoid',
                            kernel_initializer='glorot_normal',
                            bias_initializer=prior_probability(),
                            name = name+'_rpn_class',trainable=trainable)(x)
    x_class_reshape = Reshape((-1, 1), name=name+'_class_reshape')(x_class)

    x_regr = Convolution2D(num_anchors * 4, (1, 1), activation='linear', kernel_initializer='glorot_normal',
                           name=name+'_rpn_regress',trainable=trainable)(x)
    x_regr_reshape = Reshape((-1,4), name=name+'_regress_reshape')(x_regr)
    return x_class_reshape, x_regr_resh
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值