一、roidb
roidb是一个list,里面包含了很多roi(一张图片的信息)。roi是dict类型,一张图片的信息
1.1 roi初始的key
- boxes: 所有的fine-scale proposal的x1,y1,x2,y2
- 1000* 4. 假设有1000个proposal
- gt_classes: 类别, 其实是恒为1
- 1000*1
- gt_ishard: 都是0
- 1000*1
- gt_overlaps: 相当于onehot编码的ground truth
- 1000*2
- flipped: False
- 标量
- seg_areas: proposal的面积
- 1000*1
1.2 roi在prepare_roidb时,又添加的key
- image: 图片的完整路径
- width:图片的宽度
- height:图片的高度
- max_classes:每个fine-scale proposal的类别编号
- 1000*1
- max_overlaps: 全是1
- 1000*1
本文详细介绍了roidb的概念及其组成元素,roidb是一个包含多个roi(图片信息)的列表,每个roi是一个字典,包含了如boxes、gt_classes等关键信息。通过准备roidb过程,还会增加更多属性,例如图片路径、尺寸等。
788

被折叠的 条评论
为什么被折叠?



