
深度学习
文章平均质量分 88
蓝田生玉123
这个作者很懒,什么都没留下…
展开
-
【2D目标跟踪】DeepSort阅读笔记(2017)
1、为什么要做这个研究(理论走向和目前缺陷) ?sort算法虽然很快,但是对于长期遮挡会出现频繁的id切换问题。MHT和JPDA,一旦遇到密集场景,其计算量会剧增,准确性也不够令人满意。2、他们怎么做这个研究 (方法,尤其是与之前不同之处) ?在sort算法(卡尔曼滤波+匈牙利匹配)基础上,加入了用深度网络提取的表观特征,联合之前的运动信息共同作为相似度计算依据,其中表观特征对于长期遮挡后再重新匹配上效果很好,而运动信息对于稳定状态估计不确定性比较低时效果很好(相机不乱动)。此外,还考虑了匈牙利算法的原创 2021-10-12 13:06:21 · 1037 阅读 · 0 评论 -
Improving Multispectral Pedestrian Detection by Addressing Modality Imbalance Problems(2020)文献解读
ECCV2020的一篇文章。摘要:模态不平衡不利于双模态多光谱行人检测训练过程。为此提出了MBNet(Modality Balance Network)来解决模态不平衡导致的不利于优化的问题。MBNet包含一个DMAF(differential modality aware fusion,差异模态感知融合)模块用来融合两个模态信息。还包含一个光照感知特征对齐模块来根据光照条件来挑选互补特征,并自适应地对齐两种模态的特征。1、 引言多光谱行人检测数据集中的模态不平衡问题可分为两类:1)光照模态不平衡。即原创 2021-01-16 19:38:26 · 2495 阅读 · 0 评论 -
LaserNet: An Efficient Probabilistic 3D Object Detector for Autonomous Driving论文解读
1、 为什么要做这个研究(理论走向和目前缺陷) ?现有的3D目标检测还是效率低。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?以原生的雷达数据(柱面图)作为输入,这样可以使得输入是密集规则的数据,包含5个通道(分别是距离r, 高度z,方位角theta, 强度e,以及一个标记是否包含3D点的通道),对每个像素点预测概率分布(相对中心点在x和y方向的均值作为偏移,以及共用的方差),根据各个像素点预测结果进行聚类,产生的同一个cluster的像素点的预测结果共同决定这个cluster对应的3D原创 2021-01-12 16:29:11 · 1112 阅读 · 0 评论 -
[目标检测]End-to-End Object Detection with Transformers文献解读(2020)
1、 为什么要做这个研究(理论走向和目前缺陷) ?以前做目标检测主流是faster rcnn之流要做anchor和NMS等手工设计。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?将目标检测问题视为集合预测问题,所预测的集合中的每个元素即每个GT集合中的元素一一对应,且每个元素输出的是相对整个图像的位置、尺寸,避免了NMS和anchor设计。具体做法就是CNN主干网络对输入图片提取特征,然后将每个特征的位置信息加上一并输入到Transformer中,输出固定个数的预测结果,每个预测结果不原创 2020-12-05 16:19:08 · 3044 阅读 · 0 评论 -
【3D目标检测】3D Object Detection Using Scale Invariant and Feature Reweighting Networks文献解读(2019)
1、 为什么要做这个研究(理论走向和目前缺陷) ?估计就是为了发论文而写的,看不出要解决什么问题。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?整体来看本文就是F-PointNet的变种,创新不大。先2D检测器crop点云视锥,然后在视锥内做点云的前背景分类,然后对前景点云做坐标系变换(基于PointNet中的T-net实现)以及做最终的3D框的回归,在最终的3D框的回归时加了通道注意力。3、 发现了什么(总结结果,补充和理论的关系)?效果不怎么样,实验也不够充分。摘要:提出了基于原创 2020-11-25 21:23:17 · 1128 阅读 · 0 评论 -
【3D目标检测】RoarNet: A Robust 3D Object Detection based on RegiOn Approximation Refinemen文献解读(2018)
1、 为什么要做这个研究(理论走向和目前缺陷) ?一般融合图像和点云信息做3D目标检测的算法对相机和激光雷达联合标定的要求极高。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?本文要解决的问题就是如何在相机和激光雷达标定没那么准的情况的下还能保证较高的性能,归根结底就是扩大搜索空间,但也不能太大,用2D检测的目标就是限制搜索空间。具体说来就是,用2D检测器做目标检测,同时还要多预测几个参数,即目标的长宽高和航向角。依据这些预测的参数(经过一系列几何变换)可以在3D点云里找到对应的候选区域,原创 2020-11-24 21:20:35 · 554 阅读 · 0 评论 -
【3D目标检测】PointPillars: Fast Encoders for Object Detection from Point Clouds论文解读(2019)
1、 为什么要做这个研究(理论走向和目前缺陷) ?VoxelNet只有4.4fps,SECOND虽然能达到20fps,但还有提升空间。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?算是对SECOND的加速版,将原来3D 体素网格的编码方式改为2D立柱方式,且改用2D 卷积而非3D 卷积处理。还有一些其他的加速操作,比如特征降维,tensorRT等。3、 发现了什么(总结结果,补充和理论的关系)?效果和SECOND差不多,但是快了很多,达到62fps。摘要:PointPillars网原创 2020-11-23 15:04:07 · 1459 阅读 · 0 评论 -
【3D目标检测】Joint 3D Proposal Generation and Object Detection from View Aggregation论文综述(2018)
1、 为什么要做这个研究(理论走向和目前缺陷) ?之前的3D目标检测方法(MV3D)有很多问题,比如定位不准,计算量大等。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?基于MV3D做改进,主要改进思路是去除一个FV视角,候选区生成时同时利用3D anchor做中介,寻找在图像特征和点云鸟瞰图特征的对应,然后用双线性插值对这两个特征resize到相同大小(3X3)后通过element-wise average实现融合,后输入RPN网络预测ROI。ROI映射到图像特征和点云鸟瞰图特征融合也是原创 2020-11-18 21:04:14 · 1168 阅读 · 1 评论 -
【3D目标检测】IPOD: Intensive Point-based Object Detector for Point Cloud论文综述(2018)
1、 为什么要做这个研究(理论走向和目前缺陷) ?F-PointNet过度依赖2D检测的结果,且不能很好出遮挡重叠问题。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?先用2D分割网络滤除3D点云中的背景点以节约计算量和减少无用3D候选框的预测,然后用PointNet++对每个前景点中预测3D候选框,同时用也用PointNet++对所有原生点云中的每个点提取一个特征。根据已经预测的3D候选框,找到这个候选框里的所有的点特征输入到第二阶段网络(又是一个简版的PointNet++)预测最终的3原创 2020-11-20 00:17:31 · 1003 阅读 · 0 评论 -
【3D目标检测】SECOND: Sparsely Embedded Convolutional Detection论文解读(2018)
1、 为什么要做这个研究(理论走向和目前缺陷) ?VoxelNet这种直接对点云进行特征提取而非手工设计特征的3D检测算法效果还行但是很慢。以前的方案朝向预测不准。2、 他们怎么做这个研究 (方法,尤其是与之前不同之处) ?提出了3D稀疏卷积(在流形卷积基础上进行优化),充分利用了计算机内存的局部性和多级缓存特性减少访存,以及成熟的GEMM计算速度优势,GPU并行计算的优势等,加速计算。提出了新的朝向编码方案,避免朝向相反但损失很大的情况。提出了新的数据增强方法,将其他点云里的目标点加到当前点云中,增原创 2020-11-21 22:10:34 · 2871 阅读 · 0 评论