Fast and Accurate CNN Object Detector with Scale Dependent Pooling and Cascad Rejection Classifiers

本文介绍了一种基于卷积神经网络的快速准确目标检测方法,包括尺度相关池化(SDP)和级联拒绝分类器(CRC)。SDP根据proposal尺寸选择不同卷积层特征,CRC则通过级联方式过滤负样本,显著提高了小目标检测性能。

论文的题目是《Exploit All the Layers: Fast and Accurate CNN Object Detector with Scale Dependent Pooling and Cascaded Rejection Classifiers》。

(本篇论文主要在Fast R-CNN基础上提出了两个创新:尺度相关的池化SDP;级联拒绝分类器CRC)

1.论文所提出的利用卷积网络的快速而精确的目标检测方法的框架结构:
o 利用卷积网络每一层的特征来拒绝负的proposals;
o 对没有被拒绝(Surviving proposals)的proposals使用论文提出的尺度相关池化SDP进行evaluate。

2.尺度相关池化(SDP)
(1)尺度相关池化模型结构图:

(2)SDP根据每个Proposal的尺寸,从对应的conv feature map上池化特征,如图所示,对于Small ROI,从Conv3特征图上池化ROI的feature patch,对于Mid ROI,从Conv4特征图上池化特征;对于Large ROI,从Conv5特征图上池化特征。

(3)SDP模型的三个分支是Conv3,Conv4,Conv5,每个分支包含2个后续的fc层,ReLU激活及Dropout层计算bbox和得分,主要对小尺寸的物体在卷积图比较大时能保存更多的信息。

(4)输入的object proposals首先根据它们的高度分成3组,然后输入到相应的ROI pooling层,从相应的卷积层输出中池化特征。
(5)实验中 
3.级联拒绝分类器(CRC)

总体思想:每个尺度组训练一个级联拒绝分类器,每个拒绝分类器有50个弱分类器组成,boosting分类器累积弱分类器的响应。

(1)级联拒绝分类器结构图:

(2)每个尺度组学习一个单独的拒绝分类器
o 假设有个proposals属于尺度组是相应的标记,如果包含一个目标则,否则为0。
o 对于,用SDP训练的CNN模型的卷积层池化特征,得到(维,此处m=7,c是卷积层的通道数);
o 这样就可以得到训练集
o 每个拒绝分类器有50个弱分类器;

为了不增加训红更强拒绝分类器的计算,使用上一级的弱分类器初始化下一级的弱分类器。
4.实验
(1)Datasets(实验数据集):KITTI检测benchmark,PASCAL VOC2007,Inner-city dataset;
(2)Network(实验网络):CNN模型是在Imagenet数据上预训练的VGG16,3个SDP分支, 
o  
o 对SDP_3使用的是2048维的fc层;
(3)Training parameters(训练参数)
o 每个图像,每个尺度组随机采样128个positive proposals,128个negative proposals;
(4)Box proposals:采用EdgeBox和ACF生成proposals。

(5)实验效果:

(级联拒绝分类器的训练构成及训练部分不是很理解,但应该是每个尺度组训练一个级联拒绝分类器的)

由于给定的参考引用未涉及EEG - DCNET快速准确的MI - EEG扩张卷积神经网络分类方法的相关内容,结合专业知识,EEG - DCNET是用于运动想象脑电图(MI - EEG)信号分类的方法。 MI - EEG信号反映了人类在进行运动想象时大脑皮层的电活动变化,对于脑机接口等领域有重要意义。EEG - DCNET利用扩张卷积来构建网络结构。扩张卷积可以在不增加参数数量的情况下,增大卷积核的感受野,让网络能够捕捉到更广泛的上下文信息,有助于提取EEG信号中的长距离依赖特征。 该方法具备快速和准确的特点。快速体现在其网络结构经过优化设计,能够在较短时间内完成对EEG信号的处理和分类,提高了系统的实时性,这对于实际应用中的脑机接口系统尤为重要。准确则源于扩张卷积对EEG信号特征的有效提取,以及网络对特征的学习和分类能力,通过大量数据的训练,网络可以学习到EEG信号中与不同运动想象任务相关的特征模式,从而准确地对信号进行分类。 ```python # 以下是一个简单的扩张卷积层示例代码 import torch import torch.nn as nn # 定义一个扩张卷积层 class DilatedConv(nn.Module): def __init__(self, in_channels, out_channels, kernel_size, dilation): super(DilatedConv, self).__init__() self.conv = nn.Conv1d(in_channels, out_channels, kernel_size, dilation=dilation) def forward(self, x): return self.conv(x) # 示例使用 in_channels = 16 out_channels = 32 kernel_size = 3 dilation = 2 dilated_conv = DilatedConv(in_channels, out_channels, kernel_size, dilation) # 模拟输入数据 batch_size = 8 sequence_length = 100 input_data = torch.randn(batch_size, in_channels, sequence_length) # 进行前向传播 output = dilated_conv(input_data) print(output.shape) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值