- 博客(33)
- 收藏
- 关注
原创 【论文翻译】GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond
GCNet: GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond摘要Non-Local Network (NLNet) 通过将特定于查询的全局上下文聚合到每个查询位置,提供了一种用于捕获远程依赖关系的开创性方法。然而,通过严格的实证分析,我们发现 non-local network建模的全局上下文对于图像中的不同查询位置几乎相同。在本文中,我们利用这一发现创建了一个基于查询无关公式的简化网络,该网络保持了 NLNet
2022-05-27 10:39:08
1635
原创 【论文翻译】Occluded Prohibited Items Detection
遮挡违禁物品检测:X 射线安全检查基准和去遮挡注意模块摘要近年来,目标检测利用深度卷积网络的进步带来了重大进展。尽管在行人检测、自动驾驶等多种情况下都取得了可喜的成果,但在机场等交通站点进行安检的 X 射线图像中违禁物品的检测却很少受到关注。同时,安检时常针对一件行李或手提箱,物品随意堆放、重重叠叠,因尺寸、视角、风格各异,导致X光图像中违禁物品的检测效果不尽如人意。这些图像。在这项工作中,首先,我们提出了一种名为 De-occlusion attention module (DOAM) 的注意机制,以
2022-05-20 17:18:43
2670
5
原创 【论文翻译】Bag of Tricks for Image Classification with Convolutional Neural Networks
使用卷积神经网络进行图像分类的一系列技巧摘要最近在图像分类研究中取得的大部分进展可以归功于训练过程的改进,例如数据增强和优化方法的变化。然而,在文献中,大多数改进要么作为实现细节被简要提及,要么仅在源代码中可见。在本文中,我们将检查这些改进的集合,并通过消融研究经验性地评估它们对最终模型准确性的影响。我们将证明,通过将这些改进结合在一起,我们能够显着改进各种 CNN 模型。例如,我们将 ResNet-50 在 ImageNet 上的 top-1 验证准确率从 75.3% 提高到 79.29%。我们还将证
2022-05-12 15:11:41
857
原创 【论文翻译】Deep Residual Learning for Image Recognition
用于图像识别的深度残差学习摘要越深层次的神经网络越难训练。我们提出了一个残差学习框架,以缓解比以前使用的网络要深得多的网络的训练。我们明确地将各层重新表述为学习参考层输入的残差函数,而不是学习未参考的函数。我们提供了全面的经验证据,表明这些残差网络更容易优化,并能从大大增加的深度中获得准确性。在ImageNet数据集上,我们评估了深度为152层的残差网络,比VGG[41]深8倍,但仍有较低的复杂性。这些残差网络的集合在ImageNet测试集上取得了3.57%的误差。这一结果赢得了ILSVRC 2015分
2022-05-11 22:28:36
791
原创 目标检测论文整理
【2018】Cascade R-CNN: Delving Into High Quality Object Detection:CVPR,2018【原文】
2022-05-07 15:45:33
776
原创 Xray数据集与论文整理
Dataset Year Classes Images Annotations Type Scene Application Availability Total Prohibited Image Bbox Mask GDX...
2022-05-04 15:40:05
3870
4
原创 【翻译】Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark
Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark论文:https://arxiv.org/abs/2108.07020代码:https://github.com/bywang2018/security-dataset摘要由于各种因素,包括类内差异、类不平衡和遮挡,使用计算机视觉技术的自动安全检查在现实场景中是一项具有挑战性的任务。由于缺乏大规模数据集,以往的方法很少解决违禁物品被故意隐藏在杂乱对象中
2022-05-03 21:29:23
2306
原创 用于杂乱x射线安全图像目标异常检测的双卷积神经网络体系结构的评估
Evaluation of a Dual Convolutional Neural Network Architecture for Object-wise Anomaly Detection in Cluttered X-ray Security Imagery摘要x射线行李安全检查广泛用于维护航空和运输安全。特别令人感兴趣的是对特定类别的物体(如电子产品、电气产品和液体)进行自动安全X射线分析。然而,当处理潜在的异常物品时,手动检查这些物品是具有挑战性的。在这里,我们提出了一种双卷积神经网络(CNN
2022-05-03 16:25:10
1090
原创 用于目标检测的细粒度动态头
Fine-Grained Dynamic Head for Object Detection摘要特征金字塔网络(FPN)提出了一种显著的方法,通过执行实例级的分配来缓解对象表示中的尺度差异。然而,这种策略忽略了实例中不同子区域的不同特征。为此,我们提出了一个细粒度的动态头,为每个实例有条件地选择来自不同尺度的FPN特征进行像素级组合,这进一步释放了多尺度特征的表示能力。此外,我们使用新的激活函数设计了一种空间门,通过空间稀疏卷积大大降低了计算复杂度。大量的实验证明了所提方法在几个state-of-the
2022-04-19 14:22:29
5293
原创 FAN 翻译
Face Attention Network: An Effective Face Detector for the Occluded Faces摘要随着卷积神经网络的发展,人脸检测的性能已经有了很大的提高。然而,由于面具和太阳镜造成的遮挡问题,仍然是一个具有挑战性的问题。对这些遮挡情况的召回率的提高通常会带来高误报的风险。在本文中,我们提出了一种新的人脸检测器,称为人脸注意网络(FAN),它可以在不影响速度的情况下显著提高人脸检测问题的召回率。更具体地说,我们提出了一个新的锚级注意力,它将突出人脸区域
2022-04-15 18:54:51
3350
原创 HiXray
Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition Module For Prohibited Items Detection摘要X射线图像中的违禁物品检测在保护公共安全方面经常发挥着重要作用,它经常处理颜色单调和光泽不足的物体,导致性能不尽人意。到目前为止,由于缺乏专门的高质量数据集,触及这一主题的研究还很少。在这项工作中,我们首先提出了一个高质量的X射线(HiXra
2022-04-09 14:53:17
6489
7
原创 GA-RPN 翻译
Region Proposal by Guided Anchoring摘要region anchors是现代对象检测技术的基石。SOTA检测器主要依赖于dense anchoring方案,其中anchor以预定义的一组scale和aspect ratio在空间区域上均匀采样。在本文中,我们重新审视了这个基础阶段。我们的研究表明,可以更有效和高效地做到这一点。具体来说,我们提出了一个替代方案,命名为 Guided Anchoring,它利用语义特征来引导anchoring。该方法同时预测感兴趣对象中心可能
2022-03-27 19:09:09
3194
原创 AABO 翻译
AABO: Adaptive Anchor Box Optimization for Object Detection via Bayesian Sub-sampling摘要大多数state-of-the-art对象检测系统都follow基于锚的diagram。在图像上密集地提出锚框,并训练网络来预测框的位置偏移以及分类置信度。现有系统预先定义了锚框的形状和大小,并使用特别的启发式调整来定义锚框的配置。 但是,当采用新数据集或新模型时,这可能不是最优的甚至是错误的。在本文中,我们研究了自动优化目标检测锚
2022-03-21 22:59:25
877
原创 【论文翻译】Cascade R-CNN: Delving into High Quality Object Detection
Cascade R-CNN: Delving into High Quality Object Detection摘要在目标检测中,需要一个intersection over union(IOU)阈值来定义正负图像。用较低IOU阈值(例如0.5)训练的对象检测器通常会产生噪声检测。然而,检测性能往往又会随着IoU阈值的提高而下降。造成这种原因的因素有两个:1)由于正样本呈指数级减少导致训练过拟合,2)在推断时,检测j器的最佳IoU与输入假设的IoU不匹配。针对这些问题,我们提出了一种多级目标检测结构Ca
2022-03-18 15:35:27
2891
原创 目标检测的发展
2014年,Ross Girshick等人提出R-CNN,首次利用CNN进行目标检测。RCNN通过Selective Search算法进行region proposals,使用CNN对proposals提取特征,然后将提取的特征输入SVM进行分类,最后利用全连接网络进行边框回归(线性脊回归)。图片要先经过Selective Search算法产生的proposals,然后在图片上截取proposals区域,对proposals区域Resize之后,将其输入CNN进行分类。proposals区域会有大量重
2022-03-17 14:34:43
4624
原创 faster R-CNN之RPN
目标检测算法依赖于region proposals算法来假设目标位置,随着SPP Net和fast R-CNN的改进,region proposals已经成为目标检测算法的瓶颈。RPN网络主要解决region proposals算法的以下问题:运行时间长。Selective Search算法与目标检测网络相比要慢一个数量级(这里的检测网络主要指Fast R-CNN),每幅图像需要2s。EdgeBoxes [6]实现了proposasl的质量和速度之间的最佳平衡,每幅图像需要的时间减少为0.2s,但是也
2022-03-16 23:20:41
2207
原创 【论文翻译】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Abstract最先进的目标检测网络依赖于region proposals算法来假设目标位置。像SPPnet[1]和Fast R-CNN[2]这样的改进减少了这些检测网络的运行时间,暴露出region proposals计算是一个瓶颈。在这项工作中,我们引入了一个Region Proposal Network(RPN ),它与检测网络共享整个图像的卷积特征,从而实现几乎无成本的region proposals。RPN 是一个全卷积网络,可同时预测每个位置的目标边界和目标分数。RPN经过端到端的训练,可以生
2022-03-16 13:39:39
1605
原创 mmdetection之dataset概述
dataset类在tools/train文件中实例化,然后传入到train_detector()函数中用于构建dataloaderdatasets = [build_dataset(cfg.data.train)] # 实例化datasetif len(cfg.workflow) == 2: # 有验证流程的话则实例化验证数据集类 val_dataset = copy.deepcopy(cfg.data.val) val_dataset.pipeline = cfg.data.tra
2022-03-09 13:42:50
1635
原创 pytorch之DP
最近在学习mmdetection的分布式数据并行,其中涉及到pytorch的DP和DDP,到网上搜集了很多资料,通过这篇文章来总结一下。一、并行随着网络模型越来越大,并行技术越来越必不可少。这篇文章中记录了我们为什么需要并行技术,以及对并行技术做了简要的总结:常见的分布式并行策略。简而言之,并行技术可以加快训练速度以及解决显存不足的问题。今天我们主要讨论的数据并行。二、DataParallelpytorch提供的DataParallel是实现数据并行最简单的方式,只需要一行代码就可以实现数据并行
2022-03-03 00:13:54
1327
原创 mmdetection之MaxIoUAssigner
MaxIoUAssigner的作用是根据bboxes和gt_bboxes的最大IoU对bboxes分配标签。所有的Assigner都继承自BaseAssigner,实现assign函数。一、计算IoU下面代码会计算gt_bboxes和bboxes之间的IoU,需要注意的是,把gt_bboxes放在bboxes前面时,overlaps每一行表示的是每一个gt_bbox与所有bbox的IoU,每一列表示的是每一个bbox与所有gt_bbox的IoU。 overlaps = self.iou_calcula
2022-02-13 14:45:28
3171
原创 python函数装饰器
有函数如下,如何在不破坏函数的情况下为函数增加输出日志功能?def say_nihao(): print('nihao')很简单,我们只需要对函数进行封装即可def log() print('我是日志') say_nihao()现在我们只需要调用log()函数即可,相信很多人都是这样写的,但是这样写有很大的弊端。我们需要找到程序中所有调用say_nihao()的地方改称log()如果现在又有一个函数say_hello()也需要增加输出日志功能,我们岂不是要再来一遍?也就是说我们刚才的
2022-01-08 17:41:56
395
原创 faster R-CNN 模型解析(torchvision版)
torchvision中已经为我们实现好了faster R-CNN模型,我们只需要调用即可。本文将对该模型做进一步的分析,使自己能够在使用过程中更加得心应手。
2022-01-06 23:12:19
3061
原创 markdown-all-in-one使用总结
vsCode 对 markdown 的支持有限,markdown-all-in-one 插件为在 vsCode 中编写 md 文件带来了强大的生产力,本文对 markdown-all-in-one 插件常用的功能进行总结
2022-01-05 17:59:57
9445
3
原创 对指针的理解
在C语言中可以认为一切皆地址。当声明变量时,程序都干了什么?int a=10;1 根据函数类型申请一块内存,并将内存的名字命名为a2 将10以二进制补码形式写入内存//赋值 我们将这种通过变量名引用变量,由系统自动完成变量名和其存储地址之间的转换的方式,称为变量的"直接引用"。利用指针我们可以做什么呢?内存是线性,因为不同类型的变量占用不同大小的内存,所以我们...
2018-12-08 19:58:28
263
1
原创 二叉树操作中的各种疑惑
目录 1 为什么要使用二级指针a 为什么不定义一个 结构体类型的指针传进去呢?b 那又是如何利用二级指针进行操作的的呢2 可不可以不使用二级指针呢? 3 用递归创建二叉树时为什么会陷入死递归呢?1 为什么要使用二级指针当函数没有返回值的时候,要想对传进去的节点进行修改,则必须传入节点的地址,因为该节点是一个结构体指针类型,则接收该结构体指针的形参要使用二级指针...
2018-12-08 17:22:19
327
原创 XML Schema快速入门(一)
目录 XML Schema的作用是什么?要不要学XML Schema技术?XML Schema难不难学? XML Schema文档快速书写(语法我们将会在例子中介绍)1 首先我们也需要对XML Schema文档进行声明(版本声明、编码声明、独立声明)2 书写根元素3 在根元素内引入命名空间声明(重点)4 声明元素1 我们想限定一个值 2 我们想限定一组值...
2018-12-01 10:38:37
608
转载 BasicStroke用法[转]
1. 基本概念在JAVA 2D开发中,BasicStroke用于定义线条的特征,我们可以调用Graphics2D类中的setStroke方法来将新创建的BasicStroke对象设置进去。BasicStroke的构造方法如下所示: 对图形的一些专业名词不熟悉的程序员来说,想要根据API说明文档来理解这个方法的使用,实在有点过于困难了,所以,在这里整理了一下,便于大...
2018-11-05 19:34:34
279
原创 Graphics类drawRect()方法参数详解
import javax.swing.*;import java.awt.*;public class Main { public static void main(String[] args) { JFrame frame=new JFrame(); mypanel panel=new mypanel(); frame.setBou...
2018-11-05 17:05:15
7693
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人