
计算机视觉
文章平均质量分 60
hb_ma
这个作者很懒,什么都没留下…
展开
-
Cvt- Introducing Convolutions to Vision Transformers
原创 2021-07-12 17:54:22 · 404 阅读 · 0 评论 -
Automatic Weakly Supervised Object Detection From High Spatial Resolution Remote Sensing Images via
本文重点解决高空间分辨率遥感图像弱监督目标检测问题,其目的是在训练阶段学习只有图像级标注的检测器,即没有目标位置信息的检测器。虽然取得了令人满意的结果,但大多数方法往往不能提供高质量的初始样品,因此难以获得最佳的目标探测器。针对这一挑战,提出了一种动态课程学习策略,通过输入与当前检测能力相匹配的难度越来越大的训练图像,逐步学习目标检测器。为此,首先设计了一种基于熵的准则来评估图像中目标定位的难度。然后,生成一个初始课程,根据训练图像的难度升序排列训练图像,从中选择容易的图像,为学习目标检测器提供可靠的实例。原创 2021-04-11 11:48:05 · 289 阅读 · 0 评论 -
Vision Transformer 技术综述
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(一):https://mp.weixin.qq.com/s/hn4EMcVJuBSjfGxJ_qM3Tw搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二):https://mp.weixin.qq.com/s/ozUHHGMqIC0-FRWoNGhVYQ搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(三):https://mp.weixin.qq.com/s/d转载 2021-03-24 22:08:58 · 984 阅读 · 1 评论 -
目标检测指标 查准率 AP 查全率 mAP Corloc
什么是IoU在目标检测算法中,我们经常需要评价2个矩形框之间的相似性,直观来看可以通过比较2个框的距离、重叠面积等计算得到相似性,而IoU指标恰好可以实现这样的度量。简而言之,IoU(intersection over union,交并比)是目标检测算法中用来评价2个矩形框之间相似度的指标IoU = 两个矩形框相交的面积 / 两个矩形框相并的面积,如下图所示:什么是TP TN FP FNTP、TN、FP、FN即true positive, true negative, false pos原创 2020-09-17 10:47:03 · 3264 阅读 · 0 评论 -
Gradient Harmonizing Mechanism
目标检测方法分为两大阵营,一类是以Faster RCNN为代表的两阶段检测的方法,一类是以SSD为代表的单阶段检测方法。两阶段方法在检测精度更出色,单阶段检测方法的Pipline则更简洁,速度更快,但是精度不如两阶段检测方法,一个原因是单阶段的检测方法受限于正负样本和简单困难样本的不均衡问题,导致训练效果不佳。为了解决这种不均衡的问题,有研究者提出了在线困难样本挖掘的方法(OHEM),但是这个...原创 2019-04-26 22:00:35 · 1290 阅读 · 0 评论 -
Region Proposal by Guided Anchoring
Region Proposal by Guided Anchoring相关链接论文地址:https://arxiv.org/abs/1901.03278概述众所周知,anchor策略是目标检测领域的基石。很多目标检测算法的高精度检测都依赖于密集的anchor策略,也就是在空间域上以预设的尺度和宽高比做均匀采样。但是,由于anchor策略产生大量冗余的anchor box,生成数目巨...原创 2019-03-31 22:50:38 · 221 阅读 · 0 评论 -
Focal Loss for Dense Object Detection
转载自:http://www.cnblogs.com/king-lps/p/9497836.html1. 总述Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重,也可理解为一种困难样本挖掘。2. 损失函数形式Focal loss是在交叉熵(Cross Entropy, CE)损失函数基础上...原创 2019-03-31 22:25:09 · 212 阅读 · 0 评论 -
2019CVPR Feature Selective Anchor-Free Module for Single-Shot Object Detection
转载自:https://blog.youkuaiyun.com/u014119694/article/details/88428707参考:https://zhuanlan.zhihu.com/p/58782838https://zhuanlan.zhihu.com/p/58508985提出了一种简单有效的单镜头目标探测器的特征选择无锚(FSAF)模块。它可以插入具有特征金字塔结构的单热探测器。F...转载 2019-04-03 21:30:44 · 461 阅读 · 0 评论 -
GIOU----Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
目前CVPR2019 accepted list已经放出,有些被录用的paper已经放在了Arxiv上,极市已将所有论文总结到github:https://github.com/extreme-assistant/cvpr2019,欢迎关注~今天介绍一篇object detection方面的文章。作者 | ywsun论文链接 |arxiv.org/abs/1902.0...原创 2019-03-15 20:48:55 · 939 阅读 · 0 评论 -
Deep Self-Taught Learning for Weakly Supervised Object Localization
转载自:https://www.cnblogs.com/Xiaoyan-Li/p/9041747.html[CVPR2017] Deep Self-Taught Learning for Weakly Supervised Object Localization 论文笔记http://openaccess.thecvf.com/content_cvpr_2017/papers/Jie_D...转载 2019-03-02 11:34:57 · 265 阅读 · 0 评论 -
深度学习 图像预处理
参考:https://blog.youkuaiyun.com/weixin_36612847/article/details/80900181vgg 预处理输入图片 height, widthRESIZE_SIDE_MIN = 256RESIZE_SIDE_MAX = 512R_MEAN = 123.68G_MEAN = 116.78B_MEAN = 103.94(该数字由数据集计算而来)...原创 2019-04-24 21:20:03 · 1543 阅读 · 0 评论 -
Global Average Pooling
转:https://blog.youkuaiyun.com/weixin_33982670/article/details/88156274GAP (Global Average Pooling)可用于模型微调,在做图像分类比赛时效果较好.最早在<<Network In Network>>中提出.在常见的卷积神经网络中,全连接层之前的卷积层负责对图像进行特征提取,在获取特征后,...原创 2019-05-22 17:34:16 · 544 阅读 · 0 评论 -
cascade-RCNN
转载自:https://www.codercto.com/a/25258.html背景介绍通用目标检测是计算机视觉领域最广为关注的问题之一。尽管近年来自于CNN的目标检测算法较传统方法在准确率上取得的突飞猛进的进展,然而较目标分类问题而言依然还有很长一段路要走。早期的目标检测方法主要是由VJ框架所引领,其核心思想是在图像上枚举大量的滑动窗口,提取滑动窗口里的图像特征,通过级联分类器对滑窗进...转载 2019-07-12 21:19:06 · 629 阅读 · 0 评论 -
M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network AAAI2019
M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid NetworkSingle-shot目标检测新模型,使用multi-level特征,收录于AAAI2019.这篇论文吸引我的地方,是对目标检测模型不同层次特征的适应性的描述。code:https://github.com/qijiezhao...原创 2019-07-15 20:32:19 · 740 阅读 · 0 评论 -
池化到底有什么用 pooling
部分内容转载自:https://mp.weixin.qq.com/s/sS75fWhgcIW2w2JCbs8YKQ今天来说说深度学习中的池化问题,包含池化的种类,作用机制以及最新的思考。1 池化还要不要了通常我们认为,池化可以增加网络对于平移的不变性,对于网络的泛化能力的提升是非常关键的。不过,到底能起到多大的正向作用,却是被很多人怀疑的。首先是Hinton,还记得Hinton提出...转载 2019-08-06 11:45:36 · 4514 阅读 · 0 评论 -
Making Convolutional Networks Shift-Invariant Again
Making Convolutional Networks Shift-Invariant Again摘要 现代卷积网络并不是位移不变(shift-invariant)的,因为小的输入移位会导致输出的剧烈变化。常用的降采样方法,如最大池化(max-pooling)、跨步卷积(strided-convolution)和平均池(average-pooling),忽略了采样定理(he...翻译 2019-08-20 23:22:34 · 614 阅读 · 0 评论 -
DR Loss : Improving Object Detection by Distributional Ranking 解决类不平衡的最新力作
摘要大多数目标检测算法可以分为两类:两阶段检测器和单阶段检测器。对于两阶段探测器,区域建议阶段可以在第一阶段过滤大量的背景候选,并且使在第二阶段的分类任务更平衡。近年来,单阶段探测器因其结构简单、效率高而受到广泛关注。与两阶段探测器不同,单阶段探测器必须在一个阶段内从所有候选对象中识别出前景对象。这种体系结构是有效的,但在两个方面可能会遇到不均衡的问题:类的不均衡与背景分布的不均衡,只有少数候...翻译 2019-08-30 10:31:48 · 3062 阅读 · 0 评论 -
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks-ICML 2019 模型缩放的最新工作
最近,谷歌基于AutoML开发了EfficientNets,这是一种新的模型缩放方法。它在ImageNet测试中实现了84.1%的准确率,再次刷新了纪录。虽然准确率只比之前最好的Gpipe提高了0.1%,但是模型更小更快,参数的数量和FLOPS都大大减少,效率提升了10倍!程序:https://github.com/tensorflow/tpu/tree/master/models/off...翻译 2019-09-03 16:37:20 · 707 阅读 · 0 评论 -
Global average Pooling
下面就介绍一下global average pooling这个概念出自于 network in network主要是用来解决全连接的问题,其主要是是将最后一层的特征图进行整张图的一个均值池化,形成一个特征点,将这些特征点组成最后的特征向量进行softmax中进行计算。举个例子假如,最后的一层的数据是10个6*6的特征图,global average pooling是将每一张...转载 2019-03-02 10:48:53 · 207 阅读 · 0 评论 -
SOFT_nms
文章转载自:https://blog.youkuaiyun.com/u014380165/article/details/79502197论文:Improving Object DetectionWith One Line of Code论文链接:https://arxiv.org/abs/1704.04503这篇ICCV2017的文章,是NMS算法的改进,从论文题目可以看出,改进仅仅花了一行代码...转载 2019-03-02 09:54:30 · 175 阅读 · 0 评论 -
Grid R-CNN 翻译
Grid RCNN时候商汤的最新力作摘要本文提出了一种新的目标检测框架Grid R-CNN,该框架采用网格引导的定位机制进行精确的目标检测。与传统的基于回归的方法不同,网格R-CNN对空间信息进行了显式捕获,具有全卷积架构的位置敏感特性。为了减少特定点预测不准确的影响,我们设计了一个多点监督公式来编码更多的线索,而不是仅仅使用两个独立的点。为了充分利用网格中各点之间的相关性,提出了一种两阶...翻译 2018-12-19 22:12:44 · 1005 阅读 · 0 评论 -
ImageNet dataset介绍
ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。能够从图片识别物体。ImageNet是一个非常有前景的研究项目,未来用在机器人身上,就可以直接辨认物品和人了。超过1400万的图像URL被ImageNet手动注释,以指示图片中的对象;在至少一百万个图像中,还提供了边界框。ImageNet包含2万多个类别; 一个...原创 2018-07-23 16:14:36 · 22252 阅读 · 5 评论 -
class-aware detector 和 class-agnostic detector
对于一个class-aware detector,如果你给它一个图像,它将返回一组bounding box,每个盒子与对象内部的类(即狗、猫、汽车)相关联。这意味着,当检测器完成检测时,它知道检测到了什么类型的对象。对于class-agnostic detector它检测一组对象,而不知道它们属于什么类。简单地说,他们只检测“前景”对象。前景是一个宽泛的术语,但它通常是一组包含我们想要在图像中...原创 2018-07-20 15:57:30 · 1760 阅读 · 2 评论 -
目标检测(target detection) DSOD: Learning Deeply Supervised Object Detectors from Scratch
转自:https://blog.youkuaiyun.com/zhangjunhit/article/details/77247695DSOD: Learning Deeply Supervised Object Detectors from Scratch ICCV2017 https://github.com/szq0214/DSOD针对目标检测问题,本文提出了不需要预训练模型的检测算法,可以看...转载 2018-08-09 13:39:02 · 1579 阅读 · 0 评论 -
目标检测--- STDN:Scale-Transferrable Object Detection
STDN:Scale-Transferrable Object DetectionCVPR2018http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhou_Scale-Transferrable_Object_Detection_CVPR_2018_paper.pdf概述当前目标检测领域主要两大分支,一个是特征提取+分类器...原创 2018-08-09 13:51:26 · 954 阅读 · 1 评论 -
ECCV 2018 | CornerNet:Detecting Objects as Paired Keypoints
来自ECCV2018 的目标检测算法,用于目标检测的新思路,缺点是作者用了10块GPU训练,迭代500K训练,对计算能力的要求较高。博主使用两块1080训练,弱到爆了code:https://github.com/umich-vl/CornerNetpaper:https://arxiv.org/abs/1808.01244以下来自http://www.xiaoxiaoxia.com/...转载 2018-08-17 22:02:26 · 1606 阅读 · 3 评论 -
Faster-Rcnn tensorflow 训练自己的数据
在本博客中,我们首先介绍相关环境的建立,利用VOC数据训练Faster-Rcnn,和自己的数据训练faster-RCNN1.环境和数据准备环境:python2.7,tensorflow,cuda8(其他版本的Python,cuda9等也是可以的,但是需要做更多的修改)。download codes:https://github.com/smallcorgi/Faster-RCNN_TF...原创 2018-08-21 12:02:33 · 603 阅读 · 0 评论 -
【目标检测】目标检测原理与实现(五)--基于Cascade分类器的目标检测
本文转载自http://blog.youkuaiyun.com/marvin521/article/details/9173645,转载为了以后阅读方便,如有侵权,请联系,立刻删除。基于Cascade分类器的目标检测 从今天开始进入基于机器学习的目标检测,前几节虽然也接触了一些机器学习的方法,但它主要是做辅助工作,机器学习的方法和非机器学习的方法结合在一起使用,说到这想起来前几天看到...转载 2018-09-13 17:36:10 · 1233 阅读 · 0 评论 -
Deep Neural Networks for Object Detection
转自:https://blog.youkuaiyun.com/u012420309/article/details/52763788采用的是AlexNet,不过稍作修改。原AlexNet网络:具体改进:1. 把最后一个层softmax改成a regession layer.predict a mask of a fixed size. 1代表this pixel lies withon...转载 2018-09-13 20:46:34 · 241 阅读 · 0 评论 -
ubuntu,Nvidia驱动,cuda8+cudnn5.1详细安装过程
环境:ubuntu 16.04 GTX 960安装步骤安装Nvidia驱动Nvidia驱动安装可以参考博客:https://blog.youkuaiyun.com/qq_20481015/article/details/82807709 CUDA 8.0安装sudo chmod +x cuda_8.0.61_375.26_linux.runsudo sh cuda_8.0.61_375...原创 2018-09-21 22:00:43 · 306 阅读 · 0 评论 -
imagenet2012数据集 迅雷下载
大家可以去官网下载,但是官网一般需要注册,所以大家可以复制下面的连接到迅雷中,下载Imagenet数据集http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tarhttp://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC...原创 2018-09-30 18:20:35 · 7399 阅读 · 2 评论 -
Check failed: result[j]->width() == 8 (5 vs. 8)
将SSD设置设置新的输出,比如添加了data1~label1;会出现此错误,解决方法为layer { name: "silence" type: "Silence" bottom: "label1"}原创 2018-11-01 23:34:46 · 1167 阅读 · 0 评论 -
ICV: Downloading ippicv_linux_20151201.tgz
载ippicv_linux_20151201,由于网络的原因,这个文件经常会下载失败需要自己下载ippicv_linux_20151201.tgz:链接,然后替换到相应文件夹下就可以原创 2018-11-05 21:18:16 · 2434 阅读 · 5 评论 -
covariate shift和Internal covariate shift
1.covariate shift在论文中经常碰到covariate shift这个词,网上相关的中文解释比较少。你可能会在介绍深度学习Batch Normalization方法的论文到中看到covariate shift这个词,并且所有看过这篇论文的或者实际做过工程的人,都知道BN这种归一化手段很好用,可以避免covariate shift那么covariate shift到底是什么?...原创 2018-11-24 23:53:03 · 1315 阅读 · 0 评论 -
BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结
转载自https://blog.youkuaiyun.com/liuxiao214/article/details/81037416深度学习是近几年最热的技术方向之一,但是在深度学习训练时一般都要用到归一化层,使其数据分布一致。1.综述1.1 介绍归一化层,目前主要有这几个方法,Batch Normalization(2015年)、Layer Normalization(2016年)、Inst...转载 2018-11-25 00:05:40 · 323 阅读 · 0 评论 -
全卷积网络 FCN 详解
文中参考:https://blog.youkuaiyun.com/nijiayan123/article/details/79416764https://www.cnblogs.com/gujianhan/p/6030639.html背景CNN能够对图片进行分类,可是怎么样才能识别图片中特定部分的物体,在2015年之前还是一个世界难题。神经网络大神Jonathan Long发表了《Fully ...原创 2018-12-19 20:34:32 · 853 阅读 · 0 评论 -
caffe deconvolution使用,反卷积层的使用
caffe是目前的使用较多的深度学习框架之一。目前在计算机视觉的相关任务中,反卷积被广泛用于各种场合,本部分主要介绍反卷积的原理以及在caffe中的使用一,基本原理可参考https://blog.youkuaiyun.com/q295684174/article/details/79064580二、caffe中的使用在g当前的caffe版本中,已经包含了DeconvolutionLayer...原创 2018-05-24 00:13:49 · 5830 阅读 · 2 评论