PointRCNN之code学习笔记

最新推荐文章于 2024-07-30 10:05:08 发布

原创最新推荐文章于 2024-07-30 10:05:08 发布 · 1.6k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#code学习

检测专栏收录该内容

1 篇文章

订阅专栏

本文详细解析了基于点云的3D目标检测流程，包括输入处理、区域提议生成、特征提取、分类与回归等关键步骤。介绍了如何从点云数据中生成初始提议，通过分类得分排序，并应用非极大值抑制（NMS）筛选最终候选框。

input -> rpn -> rpn_cls，rpn_reg, backbone_xyz, backbone_features
rpn_cls, rpn_reg, backbone_xyz -> proposal_layer -> rois, roi_scores
rpn_score_norm = sigmoid(rpn_cls)
seg_mask = rpn_score_norm > score_thresh
pts_depth = norm2(backbone_xyz.z)
rcnn_input = ‘rpn_xyz(backbone_xyz), rpn_features(backbone_features), seg_mask,
roi_boxes3d(rois), pts_depth’

rcnn_int -> rcnn_net -> rcnn_cls, rcnn_reg

如何产生proposals：
1、以每一帧上前景点（总数为N个）为中心，在每个点上，利用回归值以及设置的平均尺寸，生成初始proposals（大小为(batch_size*N, 7), [x,y,z,h,w,l,ry]）
2、根据分类得到的得分，进行排序
3、对每一帧上排序后的proposals，根据其坐标z值来查找proposals：
0<z<=40: 取前6300个proposal, 然后将这些proposals投影到BEV，利用NMS（根据阈值设置），找前358个（不足时，保持NMS处理后的个数）
40<z<=80：取前2700个（不足2700时，取其本来有的个数），然后利用NMS，找前154个（同上）
4、返回生成的bbox3d及其对应的scores.