
CV
玄云飘风
这个作者很懒,什么都没留下…
展开
-
CS131学习笔记(lecture7)
讲义地址:http://vision.stanford.edu/teaching/cs131_fall1718/files/07_DoG_SIFT.pdf 上节说到,RANSAC对于尺度变换下的关键点检测效果不理想,所以本节将关注一些在尺度变换下依然可以有效检测的方法。尺度不变检测从直觉上,我们在进行不同尺度下的特征检测时,需要选取范围不同的窗函数(以下以圆圈为例),即:对比例尺较小...原创 2018-04-09 11:24:48 · 1878 阅读 · 3 评论 -
【opencv】安裝python接口
系統:ubuntu18.04LTSpython版本:python3.6opencv版本:opencv4.0.0其他部分按照 https://docs.opencv.org/master/d7/d9f/tutorial_linux_install.html 这里进行即可,其中cmake命令执行如下:cmake -D CMAKE_BUILD_TYPE=RELEASE \ -D PYTH...原创 2018-12-15 10:37:45 · 702 阅读 · 0 评论 -
【论文快读】AlexNet(2012)
题目:ImageNet Classification with Deep Convolutional Neural Networks 作者:Alex Krizhevsky; Ilya Sutskever; Geoffrey E. Hinton 摘要: 60,000个参数,650,000个神经元,5个卷积池化层,3个全连接层,1000路的softmax,使用ReLU实现加速,使用drop...原创 2018-05-31 20:48:44 · 324 阅读 · 0 评论 -
【论文快读】ZF-Net(2013)
链接:http://www.arxiv.org/abs/1311.2901 作者:Matthew D. Zeiler, Rob Fergus 摘要:原创 2018-05-11 20:45:35 · 473 阅读 · 0 评论 -
【论文快读】LeNet(1998)
作者:Yann LeCun,Yoshua Bengio 链接:http://yann.lecun.com/exdb/publis/pdf/lecun-bengio-95a.pdf相当老的一篇文章,基本上属于CNN开山之作级别。作者首先比较了多层(全连接的)BP网络(全连接的)和CNN,前者作为古老的经典模型,固然有着许多诸如自提取特征、大数据可学等这样的优点,然而对于图片、语音、文本等数...原创 2018-06-22 23:04:17 · 1013 阅读 · 0 评论 -
【论文快读】VGG-Net(2014)
标题:VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION链接:https://arxiv.org/abs/1409.1556作者:Karen Simonyan等摘要:VGG和GoogLeNet同期,在ZF-Net和OverFeat之后,其贡献是在比之前的架构大大增加了深度,同时在ZF-Net的基础上完善了小卷...原创 2019-02-17 14:31:04 · 433 阅读 · 0 评论 -
【PyTorch1.0】torchvision文档翻译(一)——torchvision Reference
原文:https://pytorch.org/docs/stable/torchvision/index.htmltorchvision 包收录了若干重要的公开数据集、网络模型和计算机视觉中的常用图像变换包参考torchvision.datasetsMNISTFashion-MNISTEMNISTCOCOLSUNImageFolderDatasetFolderImag...翻译 2019-02-22 19:58:48 · 621 阅读 · 0 评论 -
【PyTorch1.0】torchvision文档翻译(二)——torchvision.datasets
原文:https://pytorch.org/docs/stable/torchvision/datasets.html所有的数据集都是torch.utils.data.Dataset的子类, 即:它们实现了__getitem__和__len__方法。因此,它们都可以传递给torch.utils.data.DataLoader,进而通过torch.multiprocessing实现批数据的并...翻译 2019-02-22 20:04:05 · 852 阅读 · 0 评论 -
【PyTorch1.0】torchvision文档翻译(三)——torchvision.models
原文:https://pytorch.org/docs/stable/torchvision/models.htmlmodels子包定义了以下模型架构:AlexNetVGGResNetSqueezeNetDenseNetInception v3你可以通过调用以下构造函数构造随机权重的模型:import torchvision.models as modelsresnet...翻译 2019-02-22 20:05:56 · 922 阅读 · 0 评论 -
【论文阅读】GoogLeNet(2014)
题目:Going deeper with convolutions链接:https://arxiv.org/abs/1409.4842作者:Christian Szegedy等摘要:这是一篇挺好玩的文章,一方面模块“Inception”和标题“go deeper”致敬了经典科幻电影盗梦空间(《Inception》&“We need to go deeper”);另一方面GoogL...原创 2019-02-17 22:16:41 · 554 阅读 · 0 评论 -
【PyTorch1.0】torchvision文档翻译(五)——torchvision.utils
原文:https://pytorch.org/docs/stable/torchvision/utils.htmltorchvision.utils.make_grid(tensor, nrow=8, padding=2, normalize=False, range=None, scale_each=False, pad_value=0)把图片排列成网格形状。参数:tensor(...翻译 2019-02-22 20:07:46 · 894 阅读 · 0 评论 -
【论文快读】R-CNN(2013)
链接:https://arxiv.org/abs/1311.2524 作者:Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik 摘要: 传统的目标检测方法是通过集成系统把低级别的图像特征和高级别的文本相组合。CNN在经典的classification task上做的已经足够好了,但是在object detection上的...原创 2018-05-10 21:53:18 · 342 阅读 · 0 评论 -
【论文快读】DCGAN(2014)
标题:UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS作者:Alec Radford等链接:https://arxiv.org/pdf/1511.06434.pdf摘要:Intro当时的CNN(LeNet、AlexNet等)主要用于监督学习,本文提出的D...原创 2019-02-23 19:27:05 · 286 阅读 · 0 评论 -
Dropout
https://stackoverflow.com/questions/53419474/nn-dropout-vs-f-dropout-pytorchimport torchimport torch.nn as nnclass Model1(nn.Module): # Model 1 using functional dropout def __init__(self, ...原创 2019-03-22 19:20:09 · 483 阅读 · 0 评论 -
Deconvolution(逆卷积)
Deconvolution的一些用途:在ZF-Net中用于对feature map做可视化:https://arxiv.org/abs/1311.2901在FCN中用于生成等于原图shape的图像:https://arxiv.org/abs/1411.4038autoencoder中用于解码器:https://docs.microsoft.com/en-us/cognitive-toolk...原创 2019-04-08 14:48:55 · 21971 阅读 · 7 评论 -
YOLO3的一些理解
关于maskhttps://blog.youkuaiyun.com/Julialove102123/article/details/79836975 :Every layer has to know about all of the anchor boxes but is only predicting some subset of them. This could probably be named s...原创 2019-06-07 23:10:01 · 1833 阅读 · 1 评论 -
resent101-DSSD报错solution
在测试resent101-DSSD时遇到如题的报错,找了好久,在https://github.com/BVLC/caffe/issues/2780 找到答案了:把python脚本中LMDB数据库的相对路径地址改为绝对路径,供局域网内的朋友参考。...原创 2018-11-08 17:49:41 · 330 阅读 · 0 评论 -
【caffe】如何借助debug_info阅读caffe日志
在中文互联网中没有找到合适的文章,翻译此文以供参考。提问在训练模型陷入困境(比如出现nans、loss不收敛)时,查看冗长的日志有时候会有意外收获,为了得到日志,需要在solver.prototxt文件中设置debug_info为True。训练日志有时候看起来长这样:I1109 ...] [Forward] Layer data, top blob data data: 0.3...翻译 2018-11-13 15:39:31 · 722 阅读 · 0 评论 -
CS131学习笔记(lecture6)
讲义地址:http://vision.stanford.edu/teaching/cs131_fall1718/files/06_ransac.pdf 本节内容可以看作是一种“自顶向下的介绍”。用于边缘检测的一种模型匹配方法: random sample Consensus (RANSAC)算法source:https://dl.acm.org/citation.cfm?id=358...原创 2018-04-02 22:11:48 · 744 阅读 · 0 评论 -
CS131学习笔记(lecture4)
课程讲义:http://vision.stanford.edu/teaching/cs131_fall1718/files/04_filters.pdf图像采样(sampling)和量化(quantization)首先,自然界中的每一景象都是“continuous”,然而这在计算机的世界观中是不可接受的。所以必须把模拟信号进行采样和量化才能得到图像矩阵,当然了,这一过程产生误差和丢失信...原创 2018-03-27 20:59:54 · 2107 阅读 · 8 评论 -
CS131学习笔记(lecture5)
讲义链接:http://vision.stanford.edu/teaching/cs131_fall1718/files/05_edges.pdf图像梯度(gradient)由于图像中平面的截止、深度的截止以及图案的构成都是以边缘(edge)为基础的,所以边缘检测成为识别图像包含信息和重建几何观测的一个重要手段。我们不难想到,借助数学中的导数工具,即可在矩阵某一维度导数突变处获得图像...原创 2018-03-29 11:23:49 · 1416 阅读 · 5 评论 -
CS131学习笔记(lecture8)
讲义链接:http://vision.stanford.edu/teaching/cs131_fall1718/files/08_seam_carving.pdf图像大小调整截至上一节,对图像匹配的介绍暂时告一段落。本节将介绍在尽量少地改变图片观感情况下的尺寸调整(resizing)问题,即: 输入图像III: m×nm×nm\times n; 输出图像I′I′I': m′×n′m...原创 2018-05-03 16:18:29 · 1130 阅读 · 2 评论 -
【论文快读】DeepFool(2016)
作者:Seyed-Mohsen Moosavi-Dezfooli, Alhussein Fawzi, Pascal Frossard École Polytechnique Fédérale de Lausanne 链接:https://arxiv.org/abs/1511.04599 摘要:原创 2018-06-05 17:41:05 · 2292 阅读 · 0 评论 -
【论文快读】Intriguing properties of neural networks(2014)
作者:Christian Szegedy, Wojciech Zaremba等 链接:https://arxiv.org/abs/1312.6199 摘要: 本文的工作包括两个方面: 1. 神经网络的一个high level units和随机若干个units的线性组合之间并没有本质上的区别。所以在高level中,发挥作用的是整个网络的空间结构,而不是单个神经元。 2. 通过对同一in...原创 2018-06-07 17:40:12 · 1528 阅读 · 0 评论 -
【论文快读】Explaining and Harnessing Adversarial Examples(2015)
作者:Ian J. Goodfellow, Jonathon Shlens, Christian Szegedy 链接:https://arxiv.org/abs/1412.6572 摘要:原创 2018-06-12 22:17:55 · 1825 阅读 · 0 评论 -
图像分类的base model
AlexNet(ImageNet2012,NIPS2012)两块GPU稀疏连接,dropout,重叠池化,ReLU,LRN,数据增强(采样、PCA) ZFNet(ImageNet2013,ECCV2014)一块GPU稠密连接,反卷积,可视化 VGG(ImageNet2014,ECCV2014)部分架构1×1卷积核,最大池化,最末段3个全连接层 GoogLe...原创 2018-07-04 10:24:39 · 653 阅读 · 0 评论 -
【PyTorch1.0】torchvision文档翻译(四)——torchvision.transforms
参考链接https://pytorch.org/docs/stable/torchvision/transforms.htmlfrom torchvision import transformsimport numpy as npfrom PIL import Imagey = Image.new('RGB',(2,2),'red') #随机生成红色PIL图片y...翻译 2018-08-28 16:04:25 · 2116 阅读 · 0 评论 -
【论文快读】Faster RCNN
本文主要解决了Fast RCNN中通过CPU运行selective search较慢的问题,转而提出RPN,借助GPU加速bbox对象框的提取。原创 2018-10-15 21:10:20 · 247 阅读 · 0 评论 -
一个好用的基于opencv的工具箱——imutils
pip主页:https://pypi.org/project/imutils/github主页:https://github.com/jrosebr1/imutils功能包括:1.最简单的图像变换bridge = cv2.imread("../demo_images/bridge.jpg")cactus = cv2.imread("../demo_images/cactus.jpg")...原创 2018-10-18 21:14:49 · 9563 阅读 · 0 评论 -
【numpy】矩阵和图片的相互转化
from PIL import Imageimport numpy as npx=np.load("universal.npy") # x.shape=m*n*3x=(x-np.min(x))*255/np.max(x)r,c,_=x.shapeim = Image.new("RGB", (r, c))for i in range(0, r): f原创 2018-10-22 19:21:46 · 7321 阅读 · 0 评论 -
【论文快读】DSSD
作者:Cheng-Yang Fu, Wei Liu等链接:https://arxiv.org/abs/1701.06659摘要:本文以新的ResNet101为基础搭建SSD,并引入反卷积层,搭建了DSSD,在小物体检测上实现了优异的效果。...原创 2018-11-02 14:32:03 · 1541 阅读 · 0 评论 -
【论文快读】SSD(2015)
作者:Liu Wei等链接:https://arxiv.org/abs/1512.02325摘要:Faster-RCNN计算成本太高,在实时应用中表现较差(7FPS),相应的速度优化方案也大多以牺牲精度为前提,本文能够实现和Faster-RCNN精度相近并达到59FPS,且速度和精度都好于当时的YOLOv1。...原创 2018-11-01 09:43:49 · 242 阅读 · 0 评论 -
【caffe】ubuntu16.04 LTS从零安装caffe
http://caffe.berkeleyvision.org/installation.html部分模块已安装过,这些模块只进行验证。先安装一堆依赖:$ sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler$...原创 2018-11-05 23:18:46 · 368 阅读 · 0 评论 -
【caffe】caffe需要shuffle训练数据吗?
原文见https://stackoverflow.com/questions/37658069/does-caffe-need-data-to-be-shuffled/37659171#37659171。本文不只是相对caffe而言的,更重要的是解释了为什么我们在训练模型的时候需要shuffle数据提问:我利用此处的代码把我的imagenet图片数据转换到caffe的db格式。数据需要s...翻译 2018-11-13 14:30:52 · 1203 阅读 · 0 评论 -
【caffe】梯度更新
最近用caffe做yolo,看到其中loss层中,和ground的匹配的anchor处的loss梯度计算和源码相反:// https://github.com/pjreddie/darknet/blob/f6d861736038da22c9eb0739dca84003c5a5e275/src/yolo_layer.c#L93-L108178 l.delta...原创 2019-06-13 21:30:38 · 555 阅读 · 0 评论