
物体检测
slothfulxtx
这个作者很懒,什么都没留下…
展开
-
Siam Mask
Paper : Fast Online Object Tracking and Segmentation: A Unifying ApproachCode : official摘要作者提出了SiamMask 的结构,可以根据上一帧的bounding box的信息对下一帧的分割掩膜进行预测, 然后再在掩膜的基础上生成该帧对应的bounding box。与其他Segmentation 的方法相比,该结构采用bbox进行mask预测,因此速度会快很多。SiamMask的实现方法比较简单,在SiamRPN.原创 2020-06-28 20:02:58 · 773 阅读 · 1 评论 -
Faster R-CNN
Paper : https://arxiv.org/pdf/1506.01497.pdfCode : official摘要Fast R-CNN将多阶段训练合并到单阶段,并将目标检测算法的结构改进为Region Proposal + CNN classifier/regressor的结构。由于Selective Search 算法进行Region Proposal时,SS算法本身并不是深度学习算法,运行在CPU上,因此计算的瓶颈位置在于SS算法上。Faster R-CNN开创性地提出了RPN网络用来.原创 2020-06-17 15:21:41 · 161 阅读 · 0 评论 -
Fast R-CNN
Paper : Fast R-CNNCode : official摘要Fast R-CNN主要解决的是R-CNN结构中的多阶段训练的问题,R-CNN在训练SVM分类和bounding box回归时,需要从磁盘中读取CNN网络提取出来的特征,在时间和空间消耗上都是非常大的。Object detection的测试过程速度也比较慢。SPP结构只改进了重复卷积问题,但是多阶段训练,需要额外的回归器,特征保存在磁盘上等缺点依旧存在。Fast R-CNN通过对网络结构的修改来解决这些问题,加速训练和测试速度的.原创 2020-06-16 22:35:41 · 150 阅读 · 0 评论 -
SPPNet
Paper : Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual RecognitionCode :摘要文中作者提出“空间金字塔池化”(spatial pyramid pooling)的池化策略,用来解决卷积神经网络的输入必须是固定大小的图片的限制。SPP-net结构能够产生固定大小的表示,而不关心输入图像的尺寸或比例。金字塔池化对物体形变具有很强的鲁棒性。因此,SPP-net可普遍改进各种基于CNN的图像分类方法。.原创 2020-06-16 19:45:15 · 484 阅读 · 0 评论 -
R-CNN
Papaer : Rich feature hierarchies for accurate object detection and semantic segmentationCode :摘要R-CNN 是 R-CNN系列(R-CNN,Fast R-CNN,Faster R-CNN等等)系列的第一篇,起到了承上启下的作用。它开创性的将CNN提取图片特征的方式引入到了Object Detection任务当中,但是使用的框架还是传统的检测框架,包括Selective Search 生成候选框,CNN.原创 2020-06-16 17:14:42 · 172 阅读 · 0 评论 -
Selective Search
Paper : Selective Search for Object RecognitionCode :摘要Selective Search 将原创 2020-06-16 12:44:14 · 175 阅读 · 0 评论 -
Efficient Graph-Based Image Segmentation
Paper : Efficient Graph-Based Image SegmentationCode :摘要Efficient Graph-Based Image Segmentation 一文是将图片看作是图论中的图进行处理,用到的方法比较简单易懂,涉及到OI/ACM中常见的概念MST,而类MST的算法流程保证算法的时间复杂度为O(n log n)。Efficient Graph-Based Image Segmentation 是在像素级上进行融合,为Selective Search 算法提供.原创 2020-06-16 10:50:16 · 332 阅读 · 0 评论 -
Histogram of Oriented Gradient
Paper : Histograms of Oriented Gradients for Human DetectionCode :摘要方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。HOG特征结合SVM分类器已经被广泛应用于图像识别中,不过现在大多数CV的特征提取已经被CNN所替代。本文主要介绍HOG descriptor的计算方法,而.原创 2020-06-15 21:14:00 · 550 阅读 · 0 评论