
计算机视觉
breeze_blows
这个作者很懒,什么都没留下…
展开
-
YOLOv4: Optimal Speed and Accuracy of Object Detection
论文链接:https://arxiv.org/pdf/2004.10934.pdf代码链接:https://github.com/AlexeyAB/darknet主要思想:利用各种universal features 包括Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training原创 2020-05-29 08:59:14 · 700 阅读 · 0 评论 -
目标分割(semantic segmentation, instance segmentation... )论文阅读
记录一下泛读过的一些实例分割的论文,持续更新。。。原创 2020-05-22 09:19:47 · 399 阅读 · 0 评论 -
Improving Convolutional Networks with Self-Calibrated Convolutions
论文链接:http://mftp.mmcheng.net/Papers/20cvprSCNet.pdfCVPR2020的一篇文章代码:https://github.com/backseason/SCNet主要思想:SCnet,提出了一个self-calibrated convolutions,其实感觉就是在channel上做attention,按照文中的说法Benefiting from...原创 2020-05-02 12:11:40 · 3780 阅读 · 1 评论 -
Deformable Convolutional Networks && Region Proposal by Guided Anchoring
https://zhuanlan.zhihu.com/p/58185157原创 2020-03-21 16:22:50 · 1626 阅读 · 0 评论 -
GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond
for different query positions, their attention maps are almost the same. the global context after training is actually independent of query position,there is no need to compute query-specific global c...原创 2020-03-15 17:08:38 · 767 阅读 · 0 评论 -
计算机视觉(CV)中的注意力Attention机制
记录看到的一些不错的attention的文章1.Squeeze-and-Excitation Networks该方法是winners of ILSVRC 2017 classification competition。主要思想就是下面这幅图。通道数为C’的feature在经过一系列卷积变换Ftr之后变成通道数为C的feature,之后便分为三个步骤,首先是Squeeze即Fsq,用...原创 2020-03-13 11:35:31 · 2914 阅读 · 0 评论 -
神经网络训练中的一些tricks
持续更新。。。总结一些关于神经网络训练的trick1. val的运用不一定最后一个epoch得到的结果就是最好的原创 2020-02-20 16:57:13 · 885 阅读 · 0 评论 -
人脸匹配(face matching)
以下是人脸匹配(face matching)的实验报告,实验中采用ldlib,facenet,arcface三种算法,简单对比了三种算法的效果,源代码见文章末尾一.问题分析1.问题描述人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸匹配就是给定任意两张人脸图像,判断这两张人脸图像中的人脸是否属于同一个人。在人脸匹配中存在着诸多难点,比如,人脸表情复杂;人脸随年...原创 2019-12-24 14:03:24 · 19583 阅读 · 14 评论 -
meanshift跟踪算法
以下是用meanshift实现目标跟踪的实验报告(包含源码),实验中详细介绍了meanshift跟踪算法的原理,结合OTB100跟踪数据集对meanshift跟踪效果进行了分析。目 录一.实验名称二.实验目的三.实验原理3.1 前言3.2 meanshift四.实验测试4.1 测试条件4.2 性能分析五.实验总结一.实验名称使用meanshif...原创 2019-12-11 08:50:31 · 4727 阅读 · 6 评论 -
FCOS:Fully Convolutional One-Stage Object Detection
ICCV2019的一篇文章,很有意思的是将目标分割的思想用到了目标检测中,提出了一种anchor-free的检测方式,取得了不错的效果论文链接:https://arxiv.org/abs/1904.013551.motivation作者认为以往的基于anchor的目标检测有以下缺点检测算法的性能对于anchor一些参数很敏感,比如size ratio,number,设置起来很麻烦...原创 2019-12-06 11:14:30 · 379 阅读 · 0 评论 -
Cascade R-CNN: Delving into High Quality Object Detection
CVPR2018的文章,通过改进two stage的目标检测算法,采用不同stage,不同iou阈值,上一个stage的输出proposals作为下一stage的输出进行训练,提升了算法的性能。文章链接:https://arxiv.org/abs/1712.00726 1.motivation:从(a)中可以看出当IOU设置为0.5(这里的iou表示的是用RPN选出2000个reg...原创 2019-12-05 09:29:51 · 527 阅读 · 0 评论 -
RCNN,Fast RCNN,Faster RCNN
2013年的RCNN,ICCV2015年的fast rcnn,以及NIPS2015的faster rcnn逐步确定了two stage目标检测的框架。本文将会主要讲述三个方面的内容:稍微对比一下rcnn,fast rcnn到faster rcnn的原理 以mmdetection中的faster rcnn复现代码为参考,讲述faster rcnn从图像输入,到计算RPN的loss,计算最后...原创 2019-12-01 19:00:45 · 758 阅读 · 0 评论 -
face recognition
以下是人脸识别face recognition的实验报告,实验中采用了HOG,EigenFace,FisherFace,颜色直方图,神经网络(基于LeNet-5)实现人脸识别,并且对各种方法的效果进行了对比。源码见文章末尾一.问题分析1.问题描述每个人的脸部特征是独一无二的。人脸识别是最常见且最普遍使用的身份识别技术。人脸识别即如何理解并识别一张脸。但是人脸识别同时也面临着很多的挑...原创 2019-11-27 18:13:44 · 588 阅读 · 9 评论 -
Focal Loss for Dense Object Detection
作为2017年ICCV的最佳学生论文,该文章主要提出了一种新的交叉熵损失函数,用于抑制one-stage在训练过程中的易分样本(包括易分正样本与易分负样本)的在loss中的比重,从而挖掘了困难样本对于detector的贡献。提高了detector的性能,为此本文设计了retinanet来验证新的损失函数的作用,通过实验结果表示,取得了不错的效果。论文链接:https://arxiv.org/a...原创 2019-11-27 09:14:32 · 976 阅读 · 8 评论 -
目标检测中的增强方式
目标检测的数据增强对于提高模型的泛化能力很有帮助,往往会用在线的方式进行,即在训练的过程中随机的对batch中的图片进行某些图像增强变换。但是离线的方式有时候也是不可少的。下面介绍一个比较好用的图像增强库:https://github.com/albumentations-team/albumentations,这个库是基于https://github.com/aleju/imgaug开发的...原创 2019-11-25 15:52:34 · 2611 阅读 · 0 评论 -
Hybrid Image
以下是做Hybrid Image的实验报告,主要实现了图像的高频与低频的融合,从而达到了远看图像与近看图像产生不同的效果。而且使用了对象对齐操作,使得不同尺寸的图像,图像中的不同大小的目标的融合成为了可能。 源码见文章末尾。一、问题分析1.问题描述一副图像的高频信息往往代表着该图像的该图像的细节信息,基本主导者人们对于图像的主要感知,然后对于图像的低频信息,...原创 2019-11-07 21:15:17 · 7006 阅读 · 20 评论 -
分组卷积(Group Convolution)与深度可分离卷积(Depthwise Separable Convolution)
常规卷积输入input[1, 3, 64, 64], kernel[3, 4, 3, 3], stride=1, padding=0, 输出output[1, 4,原创 2019-08-06 09:10:12 · 3998 阅读 · 1 评论 -
感受野的计算
net_struct = { 'alexnet': {'net': [[11, 4, 0], [3, 2, 0], [5, 1, 2], [3, 2, 0], [3, 1, 1], [3, 1, 1], [3, 1, 1], [3, 2, 0]], 'name': ['conv1', 'pool1', 'conv2', 'pool2', 'conv3', '...原创 2019-05-16 15:16:11 · 265 阅读 · 0 评论