
论文阅读
文章平均质量分 90
twn29004
这个作者很懒,什么都没留下…
展开
-
Multimodal Virtual Point 3d Detection---使用虚拟点实现跨传感器融合
代码链接paper链接个人博客问题本文提出了一种针对二维和三维信息融合的方法以解决三维点云稀疏难以检测远处的目标的问题。解决方法本文的主要步骤是首先对与点云对应的二维RGB图像进行语义分割。然后讲三维点云投影到二维RGB相机坐标内。仅考虑位于前景点实体分割中的点。根据位于前景实体区域内的点云生成虚拟点。其生成虚拟点的方法是在二维前景实体分割区域中进行随机采样KKK个点,然后根据这KKK个点周围的最近的几个原始点云的深度插值出虚拟点的深度,然后讲这些虚拟点反向投影回三维空间中,同时这些虚拟点包含.原创 2022-02-28 15:05:02 · 3377 阅读 · 0 评论 -
【三维目标检测】---3D IoU Net论文解读,预测IoU
代码链接paper链接个人博客问题本文首先说明了一个问题就是NMS是一个非常重要的去除预测结果中重复的后处理过程。一些工作已经发现在NMS中使用IOU来作为排序的标准能够取得更好的效果。这里作者还用一个实验证明了上述说法的正确性。上表中的Ground truth IoU表示的是通过计算预测的边界框与基准值之间的IoU作为NMS中的分数的标准。从上表的结果可以看出,在使用IoU来知道NMS之后,模型的精度得到了非常大的提高。此外,之前的一些工作已经做出了使用预测IoU而不是预测class sco.原创 2022-01-13 20:40:38 · 1982 阅读 · 0 评论 -
NMS-Free论文---Relation Networks for Object Detection解读
代码链接paper链接个人博客问题本文首先提出了一个目前在目标检测领域的一个共识就是: 丰富的上下文信息和目标之间的关系能够更好的帮助网络去检测目标。但是现有的网络都没有很好的利用这个信息,或者说现有的卷积神经网络都不能很好的处理这些问题。原因是一个场景中往往有很多类别的目标,且类别的数目是不一定的,而且目标的数目也是不一定的。因此,按照之前的CNN网络很难对这些目标之间的关系进行建模。作者受到在NLP领域中非常成功的Transformer的影响,提出了一种自适应的注意力网络用于目标检测领域。作者.原创 2022-01-07 20:31:07 · 924 阅读 · 0 评论 -
三维目标检测---PartA2论文解读
代码链接paper链接个人博客问题不同于二维目标检测,三维目标检测中的基准框包含着大量的信息,其能够很自然的提供前景点的标记,甚至提供位于基准框中各个点的内部相对位置。而这些信息对于三维目标检测是非常重要的。三维目标网络的内部相对位置包含了三维基准框内点的分布,这类信息能够很轻易的从点云数据中获得,且包含大量的信息,但是之前从来没有三维边界网络使用这些信息。基于这个观察,本文作者提出了Part-Aware and Part-Aggregation网络.内部相对位置的图示。通过这些相对位置,可.原创 2022-01-02 19:22:22 · 2510 阅读 · 0 评论 -
三维目标检测新SOTA---ADFDetV2论文解读
问题本文提出了一种单阶段的三维目标检测算法,并在文中分析了二阶段三维目标检测算法的不必要性。其所提算法在waymo实时目标检测竞赛中取得了第一的成绩。其性能超过了所有单阶段和多阶段的目标检测算法。作者首先分析了二阶段目标检测算法主要有两个作用,一是二阶段中逐点的特征可能能够在一定程度上恢复因为前期的体素化,卷积的步长和感受野的缺乏带来的信息损失。另一个原因是因为分类和回归这两个独立的分支可能在一定程度上不能对齐,因此需要一个二阶段的网络来进行调整。对于逐点的特征能够在一定程度上恢复因一系列操作带来的原创 2021-12-30 16:45:13 · 1791 阅读 · 1 评论 -
二维目标检测sota---TOOD任务对齐的一阶目标检测算法
本文首先提出了一个目前一阶目标检测器存在的普遍问题就是在head部分将分类和定位这两个任务并行的来做了。这样的话就存在两个任务之间不对齐的问题。因为两个任务是的目标不一样。分类任务更加关注目标的显著的,关键的特征。而定位任务更加关注图像的边界特征。这就导致当使用两个独立的分支来进行预测的时候,会导致一定程度上的结果的不能对齐。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vf1SECW3-1640333431153)(https:/原创 2021-12-24 16:15:10 · 2476 阅读 · 0 评论 -
三维目标检测---BtcDet论文解读 Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
个人博客代码链接paper链接提出的问题作者首先指出LiDAR帧其实不是严格意义上的3D结构,而是一个2.5D的结构。因为LiDAR通常只能获得目标靠近传感器那部分的结构特征,远离传感器部分的结构通常因为遮挡难以获得。作者将这个问题称为shape miss.作者在引言中回答了关于shape miss的两个重要问题:点云中造成shape miss的主要原因是什么。在三维目标检测中shape miss带来的影响。造成shape miss主要由三个原因:外部遮挡。前方物体挡住了后面的物体,.原创 2021-12-21 15:33:34 · 2457 阅读 · 0 评论 -
三维目标检测----Attentional PointNet for 3D-Object Detection in Point Clouds论文解读
代码链接paper链接论文总结这是2019年CVPR的一篇文章,本文提出了一种新的利用循环神经网络来做三维目标检测的方法。并且使用了类似于BERT中讲图像分割成patch的方法来处理大型的点云场景。本文的实验效果一般,速度在kitti排行榜上也很一般,不知道为什么能发CVPR. 下面简单介绍一下本文的主要思想。作者首先讲点云场景划分为12×1212 \times 1212×12大小的patch,并将其在zzz轴上投影得到一个深度图。使用PointNet来处理点云,使用卷积神经网络来处理深度图,然.原创 2021-12-15 22:02:44 · 2799 阅读 · 0 评论 -
三维目标检测--VoteNet增强版--MLCVNet论文解读
本文首先提出了三维目标检测中对于一些含有点云数量很少的目标,人类都难以辨别,此外,大部分的网络都是单独的考虑每一个proposal,这也大大加大了网络来辨别的难度。此外,作者通过观察发现,如果能够结合上下文信息的话,我们可能能够更加简单的辨别出所需要的目标。上图是作者用来展示上下文信息的重要性的。如果单独拿一个目标出来,人类肉眼都难以辨别这个是什么类型的目标,但是如果知道这是一个餐厅的话,有60%的概率能够辨别出来是椅子,如果能够知道这个目标周围有社么的话,有85%.原创 2021-12-14 11:04:18 · 3204 阅读 · 5 评论 -
三维目标检测---RPVNet论文解读
代码链接RPVNet: A Deep and Efficient Range-Point-Voxel Fusion Network for LiDAR Point Cloud Segmentation (arxiv.org)论文总结本文实现了一种大场景下的点云语义分割网络,并在SemanticKITTI数据集上实现了1st的结果。其主要通过一种融合的方法来实现。不同于以往的使用基于点,基于体素和基于深度图(Range Image)的方法.但是这些方法都有一定的缺点。之前融合的方法也仅是融合其中的两类.原创 2021-12-11 20:54:28 · 2748 阅读 · 0 评论 -
三维目标检测中的RPN网络总结
常见的RPN网络Faster-RCNN中的RPN网络在Backbone生成的特征图中,使用大小为3×33\times 33×3的卷积处理特征图,针对每一个中心点生成一个256维的向量。特征图可以理解为原图的一种缩小版。 使用3×33\times33×3的卷积处理特征图可以对应到原图中的一个区域。然后RPN网络的目的就是在原图中的各个区域放置anchors。然后根据提取的特征判断这些anchor是否合理以及之后对这些anchor进行调整。针对特征图中的每一个中心点,使用3×33\times33×3的卷原创 2021-12-11 20:54:00 · 2379 阅读 · 0 评论 -
三维目标检测---PointCloudTransformer论文解读
代码链接paper链接论文总结本文提出了一种在适用于点云的Transformer结构。根据点云数据的特点进一步改善了Transformer的结构。其主要做了三点改进:基于坐标的输入嵌入方法改进的offset-attention方法(想法主要来源于图神经网络)邻近点嵌入方法下面依次介绍上述三种改进点以及改进的原因。首先介绍原始的Transformer结构在点云中的使用。使用点云的Encoder结构来提取点云的特征。首先使用一个输入嵌入层来转化点云的坐标,就是将三维的点云坐标映射到一个.原创 2021-12-11 20:53:22 · 2007 阅读 · 0 评论 -
三维目标检测----CT3D论文分享
代码链接paper链接论文总结本文提出了一种目前二阶段的目标检测算法不能很好的提取proposal中的特征。本文提出了一种基于通道层面的self-attention结构来提高网络对于proposal中点的特征的提取能力。下面简单介绍一下网络的处理流程:与传统的二阶段目标检测器一样,首先使用一个backbone提取点样场景的特征,然后使用RPN网络生成proposal。注意,这里生成的proposal一个三维的边界框。文中为了能够更好的提取其周围点云的特征,将这个三维边界框转化成了一个不限制高度.原创 2021-12-11 20:52:47 · 1350 阅读 · 0 评论 -
三维点云---BANet(Boundary aware Net)
代码链接paper链接论文总结本文首先提出了一个目前二阶段目标检测网络存在的问题,就是第一阶段提出的proposal通常与真实的边界框存在一定的偏移,特别是在距离较远,包含点很少的目标。例如上图中的(a),©,(d)中提出的proposal.由于偏移的存在,这样的话这些边界框就很难获的目标的边缘信息。此外,现存的refine的网络也没有聚合或者补偿这些边界信息的机制。此外,现存的网络在优化这些proposal的时候,通常是独立的来优化这些proposal,本文中提出了一种将这些proposal建立.原创 2021-12-11 20:49:13 · 991 阅读 · 0 评论