
目标识别
文章平均质量分 74
cv_family_z
这个作者很懒,什么都没留下…
展开
-
论文提要“Visual Categorization with Bags of Keypoints”
‘Selective Search for Object Recognition” 文章中特征描述使用了BOW,找到这篇文章看了一下,主要是提取BOK来做广义的目标归类,分类器使用的是朴素贝叶斯和SVM,实验对七类广义目标进行归类,目标姿态不一,背景复杂,跟我们之前接触的纯目标分类有所不同,有人脸,建筑物,汽车等,如下图所示: 特征使用的是BOK,统计图像中特定模式出现次数的直方图,这里的K是ke原创 2015-07-03 16:42:46 · 1588 阅读 · 0 评论 -
SPPNet
CNN网络需要固定尺寸的图像输入,SPPNet将任意大小的图像池化生成固定长度的图像表示,提升R-CNN检测的速度24-102倍。固定图像尺寸输入的问题,截取的区域未涵盖整个目标或者缩放带来图像的扭曲。事实上,CNN的卷积层不需要固定尺寸的图像,全连接层是需要固定大小输入的,因此提出了SPP层放到卷积层的后面,改进后的网络如下图所示: SPP是BOW的扩展,将图像从精细空间划分到粗糙空间,之后将局原创 2015-07-10 16:57:48 · 18724 阅读 · 8 评论 -
Actions and Attributes from Wholes and Parts
ICCV 2015 本文主要是用CNN网络进行人体部件检测,再用CNN进行人的属性及动作分类。 人的部件检测如下图所示:输入多尺度图像,提取第五卷积层特征,再用部件模型对特征层进行卷积,得到多尺度部件概率图。 对于人的属性及动作分类,首先将部件及整个人的图像输入CNN网络,然后提取CNN第七层特征,然后使用线性SVM分类器进行分类。 结果: 属性识别结果 动作识别结果:原创 2015-12-10 11:10:17 · 1718 阅读 · 0 评论 -
目标检测“A MultiPath Network for Object Detection”
对Fast-RCNN方法做了三个小的修改:(1)检测器能够访问多层特征,(2)foveal结构多尺度提取目标上下文信息,(3)在多个IOU下优化损失函数。网络的结构如下图所示; Foveal结构 在目标识别时,上下文信息很重要,为了增加上下文信息,作者增加了4个裁切,即分别对proposal的视图放大1,1.5,2,4倍,每种情况使用ROI-池化生成特组图,接下来的流程共享相同的结构,之后将4个原创 2016-04-15 10:33:40 · 2793 阅读 · 3 评论 -
论文提要“Training Region-based Object Detectors with Online Hard Example Mining”
基于区域的Convnet目标检测有许多超参数如负样本与groundtruth的IOU,正负样本比例等,作者提出了一个在线的困难负样本挖掘方法OHEM,自动筛选困难负样本可以提升训练的效率。挖掘负样本的技术即bootstrapping,就是通过迭代训练找虚警样本更新模型,使用更新的模型进一步找虚警样本,Felzenszwalb证实在DPM中通过bootstrapping SVM可以在整个数据集上找到最原创 2016-05-13 15:34:15 · 2677 阅读 · 1 评论 -
LocNet: Improving Localization Accuracy for Object Detection
这篇论文主要目的是提升检测框与目标的吻合度,特别是当IOU比较大时。之前主要使用bbox回归的方法,作者通过给搜索区域的每列或每行,或在目标bbox内分配概率解决,如下图所示:检测方法步骤:1.给定候选框,分配置信度;2.给定候选框,放大得到搜索区域,迭代得到新的更接近目标的候选框,算法流程如下:给定搜索区域R,划分成M个水平区域和竖直区域,返回每个区域的条件概率,考虑了In-Out概率和边界概率两原创 2016-07-27 17:00:33 · 4670 阅读 · 5 评论 -
Faster R-CNN
训练步骤及资源下载 http://blog.youkuaiyun.com/sinat_30071459/article/details/51332084摘要:SPPNet和Fast R-CNN降低了网络学习特征的时间,SS由于需耗时1~2s,EdgeBoxes 耗时约0.2s,提取proposal的方法成为检测的瓶颈。本文提出了Region Proposal Networks(RPNs)实现实时提取p原创 2015-07-13 16:44:05 · 6870 阅读 · 0 评论