
faster-rcnn
Snoopy_Dream
这个作者很懒,什么都没留下…
展开
-
rbgirshick/py-faster-rcnn训练过程中xml读取的过程
imdb表示image databaseind表示index在tools\train_net.py中from datasets.factory import get_imdb #与下文相关的头文件def combined_roidb(imdb_names): def get_roidb(imdb_name): imdb = get_imdb(imdb_name)# 调用该函...原创 2018-04-17 22:14:01 · 774 阅读 · 0 评论 -
RPN 预备编程知识(二) : 函数篇章 bbox_transform.py
目录1. bbox_transform 计算与anchor有最大IOU的GT的偏移量2. bbox_transform_batch3. bbox_transform_inv 根据anchor和偏移量计算proposals4. clip_boxes 将proposals的边界限制在图片内5. clip_boxes_batch6. bbox_overlaps (附手绘理解IOU...原创 2018-11-02 22:38:40 · 4054 阅读 · 1 评论 -
faster rcnn中 损失函数(一)——softmax,softmax loss和cross entropy的讲解
先理清下从全连接层到损失层之间的计算。来看下面这张图,(非常好的图)。 T类 N表示前一层特征层flatten后的数字 fltten后的特征 无限大小的T类 从0-1的T类向量 这张图的等号左边部分就是全连接层做的事,W是全连接层的参数,我们也称为权值,X...原创 2018-11-06 22:59:12 · 11386 阅读 · 4 评论 -
RPN 预备编程知识(一) : Numpy VS Pytorch ( Anchor_target_layer )
目录1. np.where(x>4) ) 知道返回[0] [1]2. np.meshgrid 构造xy轴3. np.ravel( ) VS np.flatten() 拉成一维4. x.reshape( ) 了解填充方式5. np.squeeze(a,axis=none) & b.squeeze(0) [ b是torch.data ]6. np.vi...原创 2018-11-03 12:12:59 · 1425 阅读 · 0 评论 -
pytorch faster rcnn复现系列(一) RPN层输入输出维度理解
目录1. 1*1 FC层2. anchor_target_layer_>rpn_data 3. 二分类 softmaxloss 4. 回归损失 rpn_loss_bbox5. softmax 二分类分类概率6. prosal_layer_>rpn_rois 2000个rpn_roi...原创 2018-11-01 12:28:41 · 6790 阅读 · 10 评论 -
ROIPooling的意义?全连接层输入需要固定尺度?全连接层的实现?为什么需要两个全连接层?
ROIPooling的作用,就是resize到统一尺寸,这样才能利用预训练的全连接层参数,大多是7*7大小,这是因为全链接层需要固定的输入尺寸.那么为什么需要固定尺寸呢?全连接层的计算其实相当于输入的特征图数据矩阵和全连接层权值矩阵进行内积以vgg16,512*7*7的特征输入为例,紧接着两个全连接层。如果是caffe,这个特征图进入全连接层之后就会被flatten成一个250...原创 2018-11-01 11:00:09 · 6550 阅读 · 0 评论 -
faster rcnn pytorch 复现系列(二):generate_anchors源码解析
目录1. 总函数 generate_anchors2. 函数分功能写,首先是ratios的实现,其次是scale的实现3. anchor2WHXY函数+WsHsXsYs2anchors函数[s表示复数]4. _ratio_enum(anchor,ratios) 5 ._scale_enum(anchor,scales)6. 最终获得的anchors的坐标:学习到的变...原创 2018-10-31 11:38:25 · 3115 阅读 · 0 评论 -
fater-rcnn绘制loss图
py-fater-rcnn根据生成的log文件绘制loss图。一般输出是下图中的第一幅图(对应位置为2,5,1),但本身并没有多大的意义,只有将其平均之后如(对应位置为2,5,6),才能看出loss是否还在下降。# -*- coding: utf-8 -*-"""Created on Wed Jun 13 09:58:00 2018@author: ygx"""# -*- coding...原创 2018-06-13 10:59:22 · 1475 阅读 · 1 评论 -
py-fater-rcnn中config.py參數的調整
faster中的兩次的負樣本都參與位置回歸,不參與分類# 最短边Scale成600__C.TRAIN.SCALES = (600,) # 最长边最大为1000__C.TRAIN.MAX_SIZE = 1000 # 一个minibatch包含两张图片,但是调用是yaml里改成1,而且只能为1__C.TRAIN.IMS_PER_BATCH = 2 -----------------...原创 2018-05-04 10:03:44 · 759 阅读 · 9 评论 -
faster-rcnn中添加Mask中的RoiAlign层,使回归框更精确( roi_align_layer.cu:240] Check failed: error == cudaSuccess *)
ROI pooling层说起ROI Alignment,就要说道faster-rcnn的ROI pooling, ROIpooling层结构是为了将原图像的rois映射到固定大小的feature map上。而此方法有一些缺点,会带来边缘像素的缺失。回顾ROIpooling。具体caffe层可以观察ROIpooling层解析ROI Align的作用如果roi大小为(7,6),而roipooling是...原创 2018-05-28 09:49:43 · 3859 阅读 · 12 评论 -
全面梳理 faster-rcnn 之训练数据是如何读入的
下面我和大家一起从训练最开始学习作者如何将原始数据读入并通过RoIDataLayer转化成网络训练所需的数据的总体过程。训练从./tools/train_net.py开始,进入主函数,我们只关注跟数据有关的模块。首先是imdb, roidb = combined_roidb(args.imdb_name)语句,传入的参数imdb_name默认是“voc_2007_trainval”,这...原创 2018-04-25 21:14:04 · 1027 阅读 · 0 评论 -
深度学习目标检测常用工具型代码:faster-rcnn测试时,检测的同时绘制检测结果
faster-rcnn的tools工具代码,模仿demo.py将所有的检测结果输出来,与此同时一边检测一边绘制于待检测的图片之上。#!/usr/bin/env python# -*- coding: utf-8 -*-# --------------------------------------------------------# Faster R-CNN# Copyright (c)...原创 2018-04-25 20:51:22 · 664 阅读 · 0 评论 -
py-faster-rcnn中调参体会
config.py的参数有目录AnchorTargetCreator(RPN开头):ProposalCreator(RPN开头):ProposalTargetCreator:AnchorTargetCreator(RPN开头):AnchorTargetCreator将 20000 多个候选的 anchor 选出 256 个 anchor 进行分类和回归位置。RPN...原创 2018-05-02 23:14:10 · 4607 阅读 · 0 评论 -
【深度学习】py-faster-rcnn中修改anchor的大小和数量
本文用到的是caffe下,rbg大神写的py-faster-rcnn。针对不同的数据集,不同大小的目标,修改anchor的大小和数量,是很有必要的,可以加快收敛的速度,提高检测精度,原始的数据集是VOC数据集,图片基本集中在500*375左右。在lib文件夹下generate_anchor.py中设计的anchor为128*128,256*256,512*512(不考虑ratios的话),而这样的...原创 2018-05-02 22:59:46 · 12334 阅读 · 10 评论 -
理解faster-rcnn overlap的具体过程
理解gt和roi之间或者说rpn之间overlap的具体过程,对于调整config中的参数,有着很重要的作用。可以参看这两篇文章Faster RCNN imdb.py https://blog.youkuaiyun.com/iamzhangzhuping/article/details/51417316py-faster-rcnn代码阅读-roidb.py https://blog.csdn....原创 2018-04-18 11:41:09 · 966 阅读 · 0 评论 -
py-faster-rcnn源码系列解读
py-faster-rcnn代码阅读1-train_net.py & train.pyhttp://www.cnblogs.com/alanma/p/6802835.htmlpy-faster-rcnn代码阅读2-config.pyhttp://www.cnblogs.com/alanma/p/6800944.htmlpy-faster-rcnn代码阅读3-roidb.py...原创 2018-04-18 11:11:22 · 749 阅读 · 0 评论 -
numpy:从多重for循环思维转换到矩阵思维
例子是bbox_overlaps计算anchors和gts的iou。输入: anchors: (N, 4) ndarray of float gt_boxes: (K, 4) ndarray of float输出: overlaps: (N, K) ndarray of overlap between boxes and query_boxes...原创 2018-11-05 22:07:19 · 4045 阅读 · 0 评论