Faster RCNN imdb.py

最新推荐文章于 2024-10-18 11:13:08 发布

原创最新推荐文章于 2024-10-18 11:13:08 发布 · 2.8k 阅读

5 ·

CC 4.0 BY-SA版权

Caffe学习同时被 3 个专栏收录

44 篇文章

订阅专栏

Deep Learning

39 篇文章

订阅专栏

Computer Vision

36 篇文章

订阅专栏

def create_roidb_from_box_list(self, box_list, gt_roidb)： 从box_list 中读取每张图像的boxes

def create_roidb_from_box_list(self, box_list, gt_roidb):

        # box_list 的大小要与gt_roidb 相同， 并且各图像一一对应
        assert len(box_list) == self.num_images, \
                'Number of boxes must match number of ground-truth images'
        roidb = []
        for i in xrange(self.num_images):
            # 遍历每张图像， 当前图像中box的个数
            boxes = box_list[i]
            # 当前这张图像中的box个数
            num_boxes = boxes.shape[0]
            # overlaps的shape始终为：num_boxes × num_classes 。
            overlaps = np.zeros((num_boxes, self.num_classes), dtype=np.float32)

            if gt_roidb is not None and gt_roidb[i]['boxes'].size > 0:
                gt_boxes = gt_roidb[i]['boxes']
                gt_classes = gt_roidb[i]['gt_classes']
                # 计算当前图像的rpn_file中记录的boxes与gtboxes的IOU overlap， 返回的gt_overlaps的
                #shape为 num_boxes × num_gtboxes， 后面要对gt_overlaps求max和argmax
                gt_overlaps = bbox_overlaps(boxes.astype(np.float),
                                            gt_boxes.astype(np.float))
                # 对gt_overlaps 求argmax 和 max
                argmaxes = gt_overlaps.argmax(axis=1)
                maxes = gt_overlaps.max(axis=1)
                # 返回 maxes > 0的位置信息
                I = np.where(maxes > 0)[0]
                overlaps[I, gt_classes[argmaxes[I]]] = maxes[I]

            overlaps = scipy.sparse.csr_matrix(overlaps)
            roidb.append({
                'boxes' : boxes,
                # gt_classes 为一个全0一维数组（这是为什么？？？？）
                'gt_classes' : np.zeros((num_boxes,), dtype=np.int32),
                # 最终还是将shape为num_boxes × num_classes 的数组进行存储， 所以，以‘rpn’方法生成的
                #rpn_roidb中的gt_overlaps是rpn_file中的box与gt_roidb中box的overlap，而不像
                #gt_roidb()方法生成的gt_roidb中的gt_overlaps全部为1.0
                'gt_overlaps' : overlaps,
                'flipped' : False,
                'seg_areas' : np.zeros((num_boxes,), dtype=np.float32),
            })
        return roidb

def merge_roidbs(a, b) 类imdb的静态方法，将a b两个roidb归并为一个roidb

@staticmethod
    def merge_roidbs(a, b):
        assert len(a) == len(b)
        for i in xrange(len(a)):
            # boxes 采用vstack
            a[i]['boxes'] = np.vstack((a[i]['boxes'], b[i]['boxes']))
            # gt_classes 采用hstack
            a[i]['gt_classes'] = np.hstack((a[i]['gt_classes'],
                                            b[i]['gt_classes']))
            # gt_overlaps 采用vstack
            a[i]['gt_overlaps'] = scipy.sparse.vstack([a[i]['gt_overlaps'],
                                                       b[i]['gt_overlaps']])
            # seg_areas 采用hstack
            a[i]['seg_areas'] = np.hstack((a[i]['seg_areas'],
                                           b[i]['seg_areas']))
        return a