对于输入的3D点云,像2D一样使用一个bounding box去将相应的物体包围起来,不过这里使用的bounding box也同样变成了3维的。
研究了什么
是对三维目标的检测,准确来说,是加入了对上下文环境后对三维目标的检测。这样提高了检测的准确性。
研究方法是什么
应该是VoteNet的改进。以VoteNet为基本方法,加入了三个子模块,分别为PPC,OOC,GSC模块。
过程是什么
整体结构分为了:特征提取模块、上下文模块、抑制模块(和输出模块嘛?)。作者简单介绍了一下特征提取,主要介绍的是上下文模块。
backbone部分,特征提取作者采用的是pointnet++,输入是N个