
深度学习
code-life
code-life
展开
-
Faster R-CNN
这三篇就够了引用1、http://shartoo.github.io/RCNN-series/2、http://hellodfan.com/2017/10/02/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-Faster-R-CNN/3、https://blog.youkuaiyun.com/hellor123/article/details/7...原创 2018-06-15 13:35:20 · 258 阅读 · 0 评论 -
论文:CenterNet: Keypoint Triplets for Object Detection 阅读笔记
一、论文CenterNet: Keypoint Triplets for Object Detectionhttps://arxiv.org/abs/1904.08189code:https://github.com/Duankaiwen/CenterNet二、笔记1、背景1)、anchor-based方法anchor方法的复杂性2)、cornernet没有好好利...原创 2019-05-23 20:58:50 · 444 阅读 · 0 评论 -
论文:Deformable ConvNets v2 阅读笔记
一、论文Deformable ConvNets v2: More Deformable, Better Resultshttps://arxiv.org/abs/1811.11168The code for DCNv2will be released.二、论文笔记1、背景a)、基于第一版的问题, 使用可变形卷积发现网络确实学会了适应物体的形状然后去关注不同形状物所覆盖的区...原创 2019-05-29 16:27:48 · 463 阅读 · 0 评论 -
论文:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 阅读笔记
一、论文(16)Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networkshttps://arxiv.org/abs/1604.02878二、论文笔记1、背景(1)、没人把facedetection and alignment结合起来做,或者前面人做得效果不太好(2...原创 2019-06-13 16:12:46 · 252 阅读 · 0 评论 -
论文:GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond 阅读笔记
一、论文(19)GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyondhttps://arxiv.org/abs/1904.11492code:https://github.com/xvjiarui/GCNet.二、论文笔记1、背景(1)、发现原版的non-local 结构针对每个查询位置...原创 2019-06-08 15:04:03 · 6675 阅读 · 2 评论 -
论文:Text-Attentional Convolutional Neural Network for Scene Text Detection 阅读笔记
一、论文(16)Text-Attentional Convolutional Neural Network for Scene Text Detectionhttps://arxiv.org/abs/1604.02878二、论文笔记1、简介这是一篇关于图片是否包含文字区域的二分类的论文1、背景(1)、文字区域只占整个图片一个很小的区域,但是图片的背景相对复杂,这样就增加...原创 2019-06-14 12:06:36 · 839 阅读 · 0 评论 -
词编码
1、词集模型词集模型:将语料库的所有不相同的词,列出一个有顺序的列表,然后根据该顺序形成一个列表长度的向量,然后根据词列表的顺序,搜索句子里是否包含该词,包含的话向量的该位置置为1,否则置为0。缺点:向量的顺序完全根据前面形成的词的列表的顺序而来,与句子的词的顺序无关,忽略了文本的词序,以及没有词语的权重信息2、词袋模型在词集模型的基础上,把置1改为词出现的频率信息或者tf-idf...原创 2019-06-09 13:36:08 · 717 阅读 · 0 评论 -
统计语言模型
详细见: https://www.cnblogs.com/peghoty/p/3857839.html1、介绍2、计算统计语言模型的参数的方法(1)、n-gram做了一个n-1介的马尔科夫假设,认为一个 词出现的概率只与它前面的n-1个词相关这样利用条件概率公式就可以统计计算了(2)、神经概率语言模型(基于n-gram的思想...原创 2019-06-09 20:03:00 · 571 阅读 · 0 评论 -
论文:CBAM: Convolutional Block Attention Module 阅读笔记
一、论文(18)CBAM: Convolutional Block Attention Modulehttps://arxiv.org/abs/1807.06521code:gihub二、论文笔记1、背景1、网络结构方面有往深度方向探索的(使用resnet结构之后,网络可以更深),有往宽度方向探索的,比如(googlenet)还有往(cardinality)方向探索的...原创 2019-06-15 22:55:07 · 951 阅读 · 0 评论 -
论文:Bag of Freebies for Training Object Detection Neural Networks
一、论文(19)Bag of Freebies for Training Object Detection Neural Networkshttps://arxiv.org/abs/1902.04103code: https://github.com/dmlc/gluon-cv二、论文笔记1、背景(1)、简单的有效的训练方式,就可以再不增加任何inference时间的情况下...原创 2019-06-20 17:48:11 · 375 阅读 · 0 评论 -
论文:Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization 阅读笔记
一、论文(16)Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localizationhttps://arxiv.org/abs/1610.02391code: https://github.com/ramprs/grad-cam/pytorch :https://github.com/jac...原创 2019-06-16 23:44:13 · 609 阅读 · 0 评论 -
论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记
一、论文(19)Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressionhttps://arxiv.org/abs/1902.09630code:https://giou.stanford.edu二、论文笔记1、背景(1)、深度神经网络的优化,目前主要集中在网络结...原创 2019-06-21 23:00:16 · 263 阅读 · 0 评论 -
论文:Training Region-based Object Detectors with Online Hard Example Mining 阅读笔记
一、论文(19)Training Region-based Object Detectors with Online Hard Example Mininghttps://arxiv.org/abs/1604.03540二、论文笔记1、背景(1)、现存的网络的启发式方法和超参数需要花费很多时间去调。(2)、数据集的样本有很多简易样本,以及一小部分的困难样本。(3)、传统...原创 2019-06-22 18:04:47 · 256 阅读 · 0 评论 -
论文:Relation Networks for Object Detection 阅读笔记
一、论文(17) Relation Networks for Object Detectionhttps://arxiv.org/abs/1711.11575code : https://github.com/msracver/Relation-Networks-for-Object-Detection二、论文笔记1、背景(1)、建模物体之间的关系对物体检测非常有益,但是...原创 2019-07-01 18:02:19 · 370 阅读 · 0 评论 -
论文:FCOS: Fully Convolutional One-Stage Object Detection 阅读笔记
一、论文(19)FCOS: Fully Convolutional One-Stage Object Detectionhttps://arxiv.org/abs/1904.01355code: https://tinyurl.com/FCOSv1二、论文笔记1、背景(1)、anchor-based 需要设置的超参数太多了,而且超参数很影响最后的结果(比如cascade ...原创 2019-06-23 16:31:55 · 629 阅读 · 0 评论 -
论文:Segmentation Is All You Need 阅读笔记
一、论文Segmentation Is All You Needhttps://arxiv.org/abs/1904.13300二、论文笔记1、基于RPN的方法对于图片里边一些特殊情况的物体的检测效果很差(召回率很差),比如这三种效果差主要有两个原因:(a)RPN高度依赖bounding box, 但是对于一些极端的例子,人工标注的ground truth ...原创 2019-05-30 17:32:01 · 966 阅读 · 0 评论 -
论文:Feature Selective Anchor-Free Module for Single-Shot Object Detection 阅读笔记
一、论文Feature Selective Anchor-Free Module for Single-Shot Object Detectionhttps://arxiv.org/abs/1903.00621https://www.cnblogs.com/fourmi/p/10602936.html二、论文笔记1、背景a)、作者提出了一个FSAF网络结构块(feature...原创 2019-05-27 15:48:14 · 487 阅读 · 0 评论 -
论文:CornerNet: Detecting Objects as Paired Keypoints 阅读笔记
一、论文CornerNet: Detecting Objects as Paired Keypoints论文:https://arxiv.org/abs/1808.01244代码: https://github.com/princeton-vl/CornerNet二、笔记1、背景a)使用anchors的one stage 方法有两个缺点:(1)大量的anchor box 降...原创 2019-05-27 15:46:58 · 187 阅读 · 0 评论 -
YOLO v1
基本上看了别人的博客和论文,自己再总结一些细节。一 、yolo v1yolo 最重要的一个特点是划分格子,这个只是我们让网络自动适应学习的一个规则,实际上我们并不会在图像上进行划分,输入的时候,我们输入的还是一整张的图片。然后输出的的时候,是按预想的格子输出的,比如划分为7*7的格子,那我们最后的输出就是7*7*30。这样好像输出的每一个长条向量(30)好像就对应图像上划分的一个格子。实际上,最后...原创 2018-06-15 13:39:36 · 206 阅读 · 0 评论 -
SPP-Net
一、简介主要贡献就是添加了金字塔层,可以应对不同大小的输入。二、过程1、首先通过选择性搜索,对待检测的图片进行搜索出2000个候选窗口。这一步和R-CNN一样。2、 特征提取阶段。这一步就是和R-CNN最大的区别了,这一步骤的具体操作如下:把整张待检测的图片,输入CNN中,进行一次性特征提取,得到feature maps,然后在feature maps中找到各个候选框的区域,再对各个候选框采用金字...原创 2018-06-15 13:46:48 · 304 阅读 · 0 评论 -
ResNet
2、深度残差网络——http://blog.youkuaiyun.com/twenty_seven/article/details/70153848这样的一个好处可能是当需要这个F(x)时,网络就会把他正常优化,当不需要这几层时,网络就会自动把它训练的趋近于0(相比于把他由非线性层拟合成恒等映射,变成0而另外直接添加一个恒等映射x会更容易),这样让网络来整体的自动选择一个最佳的网络的层数。那么实际的映射关系即...原创 2018-06-15 14:15:30 · 1446 阅读 · 0 评论 -
论文:Feature Pyramid Networks for Object Detection 阅读笔记
一、简介引用:http://hellodfan.com/2017/10/14/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-SSD%E5%92%8CFPN/二、流程在RPN+FAST R-CNN里边 嵌入FPN的流程图1、第一种不知是不是存在,与第二种的差别,就是最后的rol不是在不同的层级的feature ...原创 2018-06-16 00:00:59 · 1094 阅读 · 0 评论 -
论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks 阅读笔记
一、简介1、R-FCN可以看做是Faster RCNN的改进版,速度上提高了差不多3倍左右,mAP也有一点提升,主要的目的是进行了加速2、当然这个算法还是属于候选窗+深度学习分类和回归系列的,也就是会包含rpn网络给出候选框建议。3、下面的这个表是共享参数的层数这篇讲解的很棒二、原理1、这篇论文是NIPS 2016的一篇论文,主要贡献在于解决了“分类网络的...原创 2018-06-16 17:12:46 · 387 阅读 · 0 评论 -
论文:Mask R-CNN 阅读笔记
一、简介Mask R-CNN是一个实例分割(Instance segmentation)算法,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。整个Mask R-CNN算法的思路很简单,就是在原始Faster-rcnn算法的基础上面增加了FCN来产生对应的MASK分支。即Faster-rcnn + FCN,更细致的是 RPN + ROIAlign + Fast-rcnn + F...原创 2018-06-17 14:52:32 · 460 阅读 · 0 评论 -
caffe2 笔记
1、Caffe中LMDB的使用 https://blog.youkuaiyun.com/haluoluo211/article/details/544274212、Protubuf Google Protocol Buffer( 简称 Protobuf) 是一种轻便高效的结构化数据存储格式https://www.ibm.com/developerworks/cn/linux/l-cn-gpb/i...原创 2018-07-19 10:14:46 · 266 阅读 · 0 评论 -
论文:DensePose: Dense Human Pose Estimation In The Wild 阅读笔记
一、论文简介:基于密集点的一个姿态估计模型作者:本文主要是Facebook AI 和INRIA(法国国家信息与自动化研究所)联合出品效果:关键点对应 2d imageà3d surface coordinate(uv坐标)将2d图像的关键点映射成一个uv坐标,然后把这个uv坐标贴回到2d 的image上。难点:存在背景,遮挡,姿态,尺度的变化。应对这个问题之前的工...原创 2019-05-17 14:23:39 · 1212 阅读 · 0 评论 -
论文:Cascade R-CNN: Delving into High Quality Object Detection 阅读笔记
一、论文Cascade R-CNN: Delving into High Quality Object Detectionhttps://arxiv.org/abs/1712.00726https://github.com/zhaoweicai/cascade-rcnn二、论文笔记1、背景a)、阈值设的太小,正负样本比例失衡,负样本太多,使得检测器对于有较大的阈值的错误框...原创 2019-05-25 19:15:11 · 264 阅读 · 0 评论 -
论文:Deep Face Recognition: A Survey 阅读笔记
一、论文Deep Face Recognition: A Surveyhttps://arxiv.org/abs/1804.06655二、论文笔记《 Deep Face Recognition: A Survey 》目前到v8分为人脸识别和人脸验证两种人脸验证: 1:1人脸识别: 1:N流程1、人脸检测(Face Detection)2、人脸对齐...原创 2019-05-25 19:21:52 · 3016 阅读 · 0 评论 -
论文:Parsing R-CNN for Instance-Level Human Analysis 阅读笔记
一、论文Parsing R-CNN for Instance-Level Human Analysishttps://arxiv.org/abs/1811.12596二、论文笔记1、分析以前的工作的问题实例级的人体分析还存在的问题(1)、mask 分支给出的是一个类无关的mask,但是实例分析需要更多的细节特征(2)、实例分析需要人体各个部分的几何和语义关系(ma...原创 2019-05-25 19:30:04 · 1781 阅读 · 1 评论 -
ICLR 2019最佳论文:The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks
一、论文The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networkshttps://arxiv.org/abs/1803.03635二、论文笔记1、摘要:神经网络剪枝技术可将网络参数量减少 90%,进而在不牺牲准确率的前提下减少存储需求、提升推断的计算性能。然而现有经验表明,剪枝生成的解析架构从一开...原创 2019-05-17 14:34:02 · 4946 阅读 · 2 评论 -
论文:Region Proposal by Guided Anchoring 阅读笔记
一、论文(19)Region Proposal by Guided Anchoringhttps://arxiv.org/abs/1901.03278二、论文笔记1、背景(1)、原本的anchors 生成不够高效(2)、不同的问题需要预先定义不同的锚,但是anchor定义的不合适的话,可能会影响结(3)、为了维持极高的召回率,需要定义很多的anchor ,这会带来很大的...原创 2019-07-15 21:35:07 · 264 阅读 · 0 评论