
算法
文章平均质量分 88
gqixl
这个作者很懒,什么都没留下…
展开
-
深度学习一些经验方法总结(很有启发)
深度学习入门知识整理-训练技巧以及模型调优:https://blog.youkuaiyun.com/ForgetThatNight/article/details/91856052一、static有什么用途?1、定义静态变量1)定义静态全局变量在普通全局变量前加关键字static就声明成了静态全局变量。如果没有初始化,则其默认值为0.二者存储方式一样,均存储在静态存储区,然而二者的作...原创 2019-09-27 17:55:53 · 1286 阅读 · 0 评论 -
卷积网络之感受野
转载 http://www.cnblogs.com/objectDetect/p/5947169.html1 感受野的概念 从直观上讲,感受野就是视觉感受区域的大小。在卷积神经网络中,感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。 2 感受野大小的计算 感受野计算时...转载 2018-09-30 11:43:48 · 565 阅读 · 0 评论 -
线性内插和双线性内插
一、线性内插 假设我们已知坐标(x0, y0)与(x1, y1),要得到[x0, x1]区间内某一位置在直线上的y值。根据图中所示, 假设AB上有一点(x, y), 可作出两个相似三角形,我们得到 : 则: ...转载 2018-10-15 17:21:32 · 3513 阅读 · 2 评论 -
详解ROI Align的基本原理和实现细节
ROI Align是在Mask-RNN这篇论文里提出的一种区域特征聚集方式,很好地解决了ROI Pooling操作中两次量化造成的区域不匹配(mis-alignment)的问题。实验显示,在检测任务中将ROI Pooling替换为ROI Align可以提升检测模型的准确性。1、ROI Pooling 的局限性分析在常见的两级检测框架(比如Fast-RCNN, Faster-RCNN, RF...转载 2018-10-15 15:25:23 · 2624 阅读 · 0 评论 -
ROI Pooling层解析
ROI Pooling的意义ROIs Pooling顾名思义,是Pooling层的一种,而且是针对RoIs的Pooling,他的特点是输入特征图尺寸不固定,但是输出特征图尺寸固定。 什么是ROI呢? ROI是Region of Interest的简写,指的是在“特征图上的框”: 1)在Faste RCNN中, RoI是指Selective Search 完成...转载 2018-10-15 14:28:46 · 1547 阅读 · 0 评论 -
详解深度学习之经典网络架构(六):ResNet 两代(ResNet v1和ResNet v2)
感谢作者:https://blog.youkuaiyun.com/chenyuping333/article/details/82344334目录一、ResNet v1二、ResNet v2一、ResNet v1 一说起“深度学习”,自然就联想到它非常显著的特点“深、深、深”(重要的事说三遍),通过很深层次的网络实现准确率非常高的图像识别、语音识别等能力。因此,我们自然...转载 2018-09-29 15:12:07 · 3324 阅读 · 0 评论 -
ResNet V1 vs V2详解
感谢作者https://blog.youkuaiyun.com/gbyy42299/article/details/81505083写的非常好!最近看李沐的gluon课程提到了conv、bn、relu等的顺序问题,现将resnet v1和v2总结如下。首先给出resnet v2的paper里面kaiming大神给出的不同的结构对比:图a为resnet v1的结构,图e为resnet v2的...转载 2018-09-29 14:39:19 · 675 阅读 · 0 评论 -
ResNet理解
1、提出shortcut connection 结构问题:网络的深度是使网络性能更优化的一个关键因素,但是随着网络深度的加深,梯度消失/包传问题十分明显,网络甚至出现退化。办法:通过引入一个深度残差学习框架,解决这个退化问题。H(x):用H(x)来表示最优解映射,即:x(input)----非线性卷积堆叠-------->H(x)(output).存在另外一种映射, F(x)...原创 2018-09-29 12:04:31 · 916 阅读 · 0 评论 -
深度学习卷积神经网络——经典网络GoogLeNet(Inception V3)网络的搭建与实现
作者总结的很好:https://blog.youkuaiyun.com/loveliuzz/article/details/79135583转载 2018-09-26 16:54:44 · 471 阅读 · 0 评论 -
卷积神经网络系列之softmax,softmax loss和cross entropy的讲解
https://blog.youkuaiyun.com/u014380165/article/details/77284921作者讲的很好。转载 2018-09-26 16:20:32 · 157 阅读 · 0 评论 -
Dilated/Atrous conv空洞卷积/多孔卷积
Dilated Dilated convolution/Atrous convolution/Atrous convolution convolution 可以叫空洞卷积或者扩张卷积。空洞卷积诞生于图像分割领域, 图像输入到网络中经过CNN提取特征,在经过pooling降低图像尺度的同时增大感受野。由于图像分割是pixel-wise预测输出,所以还需要通过upsampling将变小的图像恢复到...转载 2018-09-30 14:52:59 · 544 阅读 · 0 评论 -
RefineNet 理解
[CVPR 17]RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic SegmentationInuition: 这篇文章提出了一套网络架构以实现高精度的语义分割任务。目前在PASCAL VOC 2012数据集上取得了最好的效果。从网络结构来看,本工作是U-Net的一个变种。文章的主要...原创 2018-09-30 16:41:31 · 23151 阅读 · 8 评论 -
tf.nn.conv2d 和tf.contrib.slim.conv2d的区别
有代码用到卷积层是tf.nn.conv2d 或者tf.contrib,slim.conv2d. 这两个函数调用的卷积层是否一致,查看源码如下:conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, ...原创 2018-10-17 12:10:35 · 1963 阅读 · 0 评论 -
【RCNN系列】【超详细解析】
转载博客:https://blog.youkuaiyun.com/Amor_tila/article/details/78809791转载 2019-03-29 11:33:07 · 439 阅读 · 0 评论 -
深度学习训练中为什么要将图片随机剪裁(random crop)
https://blog.youkuaiyun.com/u010165147/article/details/78633858转载 2019-04-08 17:02:25 · 10689 阅读 · 0 评论 -
推荐系统学习
资料地址:https://blog.youkuaiyun.com/jiangjiang_jian/article/category/7476644/2?转载 2019-02-26 16:35:13 · 130 阅读 · 0 评论 -
准确率 召回率 ROC曲线的大解析
近来面试算法、机器学习岗,发现面试官经常问的就是准确率召回率之间的关系,以及roc曲线如何画,这里自己总结了一波做了一波解析。对于一个二分类的问题来看,可以用下表来表示整个结果,其中1代表正例,0代表负例 接下来我们一个一个来解释 TP(真正类):表示为被预测为正例实际也是正例。 FP(假正类):表示被预测为正但是其实是负例。 FN(假负类):表示为被预测为负其实是正例 TN...转载 2019-01-16 15:43:54 · 1655 阅读 · 0 评论 -
pytorch学习: 构建网络模型的几种方法
作者写的很好:https://www.cnblogs.com/denny402/p/7593301.html用pytorch来构建网络模型有很多种方法,以下简单列出其中的四种。假设构建一个网络模型如下:卷积层--》Relu层--》池化层--》全连接层--》Relu层--》全连接层首先导入几种方法用到的包:import torchimport torch.nn.functio...转载 2019-01-17 15:51:16 · 1936 阅读 · 0 评论 -
widerface数据集下载及转voc2007格式(基于python2.7和python3.5)
最近看了看YOLO从v1到v3,想用widerface数据集训练yolov3去进行人脸检测。首先需要做的就是将widerface数据集的格式转化为VOC格式。由于编程能力不强,在网上看了看代码,发现 https://www.cnblogs.com/linyuanzhou/p/6043436.html为了省事,便借用一下,但是由于他的代码估计是基于python2.7,实测python2.7可以...转载 2019-01-10 16:51:43 · 1113 阅读 · 0 评论 -
【直观详解】什么是正则化
【内容简介】主要解决什么是正则化,为什么使用正则化,如何实现正则化,外加一些对范数的直观理解并进行知识整理以供查阅Why & What 正则化我们总会在各种地方遇到正则化这个看起来很难理解的名词,其实它并没有那么高冷,是很好理解的首先,从使用正则化解决了一个什么问题的角度来看:正则化是为了防止过拟合, 进而增强泛化能力。用白话文转义,泛化误差(generalizati...转载 2018-12-28 11:34:23 · 1626 阅读 · 0 评论 -
读懂Faster RCNN
经过R-CNN和Fast RCNN的积淀, Ross B.Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征抽取(feature extraction), proposal提取,bounding box regression(rect refine), classification都整合在了一个网络种,使得综合性能有较大的提高,在检测速...转载 2018-10-31 17:39:44 · 746 阅读 · 0 评论 -
多通道卷积后通道数计算理解
记忆为:卷积的深度(通道数)和卷积核的个数一致。1、单通道卷积 一个卷积核得到的特征提取是不充分的,我们可以添加多个卷积核。2、多通道多个卷积核卷积计算: 图片的宽高分别用W, H来表示,图片的通道数为D,一般目前都用RGB三通道D=3, 为了通用性,通道数用D表示;卷积核:卷...原创 2018-10-31 11:46:41 · 7362 阅读 · 1 评论 -
一次卷积计算量
动态卷积过程:转载 2018-09-26 15:42:57 · 1297 阅读 · 0 评论 -
浅析正则表达式—(原理篇)
转载来源:http://www.cnblogs.com/dwlsxj/p/Regex.html其实这篇文章很久之前就应该发出来,由于种种原因没有发出来,如果这篇文章中有错误,还请大家指出,小弟并改正之,没有学不会的东西,只有不想学的东西,只要功夫深,铁杵磨成针,我的至理名言:吾生也有涯而知也无涯,以有涯随无涯,殆矣。我们只要坚持将其看完,相信大家的正则表达式会有一个提升空间!本文属于.NET正...转载 2018-08-09 10:54:35 · 291 阅读 · 0 评论 -
caffe框架下目标检测——faster-rcnn实战篇操作
原有模型1、下载fasrer-rcnn源代码并安装git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git1) 经常断的话,可以采取两步:git clone https://github.com/rbgirshick/py-faster-rcnn.git2) 到py-faster-rcnn中转载 2018-01-25 11:09:52 · 452 阅读 · 1 评论 -
卷积层储存量和计算量
--- ---对某一层卷积层,卷积参数数量为: P = C(上一层卷积数量) * Kh(卷积核高) * Kw(卷积核宽) * N(卷积核数量)分解后则是 P = P1+P2 = C(上一层卷积数量) * Kh(卷积核高) * D(分解核数量) + D(分解核数量) * Kw(卷积核宽) * N(卷积核数量)所以只有当 P1 + P2 < P 才有低秩分解能够优化储存性能的说原创 2018-01-24 10:10:25 · 2943 阅读 · 0 评论 -
深度学习目标检测最全最新的方法paper和代码
Jump to...LeaderboardPapersR-CNNFast R-CNNFaster R-CNNMultiBoxSPP-NetDeepID-NetNoCDeepBoxMR-CNNYOLOYOLOv2AttentionNetDenseBoxSSDDSSDInside-Outside Net (ION)G-CNNHyperNetMultiPathNetCRAFT转载 2017-12-27 16:23:04 · 3509 阅读 · 0 评论 -
faster-rcnn 之 RPN网络的结构解析
【说明】:欢迎加入:faster-rcnn 交流群 238138700,我想很多人在看faster-rcnn的时候,都会被RPN的网络结构和连接方式纠结,作者在文中说的不是很清晰,这里给出解析;【首先】:大家应该要了解卷积神经网络的连接方式,卷积核的维度,反向传播时是如何灵活的插入一层;这里我推荐一份资料,真是写的非常清晰,就是MatConvet的用户手册,这个框架底层借用的是caffe的算法转载 2017-12-25 15:05:31 · 541 阅读 · 0 评论 -
Batch Normalization解析
转载:http://blog.youkuaiyun.com/intelligence1994/article/details/53888270白化(sphering)参考http://ufldl.stanford.edu/wiki/index.php/%E7%99%BD%E5%8C%96举例来说,假设训练数据是图像,由于图像中相邻像素之间具有很强的相关性,所以用于训练时输入转载 2017-12-22 14:26:30 · 536 阅读 · 0 评论 -
几种CNN网络结构及其资源使用
感谢博主:http://blog.youkuaiyun.com/fdchao/article/details/52915716本文主要参考stanford课程CS231n-lecture7,对几种典型CNN网络结构(LeNet、AlexNet、ZFNet、VGGNet、ResNet)及其资源使用(主要针对权重个数、层间存储)进行统计与分析。1、LeNet图1-1 LeNet结构示意转载 2017-12-21 14:05:40 · 829 阅读 · 0 评论 -
卷积神经网络中卷积、反卷积、池化解析
感谢博主:http://blog.youkuaiyun.com/fate_fjh/article/details/52882134http://blog.youkuaiyun.com/u010402786/article/details/51541465 1.前言 传统的CNN网络只能给出图像的LABLE,但是在很多情况下需要对识别的物体进行分割实现end to end,然后FCN出现了,给物体分原创 2017-11-16 11:51:09 · 7423 阅读 · 1 评论 -
RNN详解
原文 http://www.jianshu.com/p/9dc9f41f0b29人类并不是每时每刻都从一片空白的大脑开始他们的思考。在你阅读这篇文章的时候,你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义。我们不会将所有的东西都全部丢弃,然后用空白的大脑进行思考,我们的思想拥有持久性。传统的神经网络并不能做到这点,看起来也像是一种巨大的弊端。例如,假设你希望对电影转载 2017-09-12 15:36:42 · 2868 阅读 · 0 评论 -
深度学习与人脸识别系列(2)__基于VGGNet的人脸识别系统
作者:wjmishuai出处: http://blog.youkuaiyun.com/wjmishuai/article/details/508541551.引言本文中介绍的人脸识别系统是基于这两篇论文:《Very deep convolutional networks for large-scale image recognition》《Deep Fa转载 2017-09-19 15:27:02 · 1556 阅读 · 0 评论 -
CNN模型之MobileNet
零引言:卷积神经网络(CNN)已经普遍应用在计算机视觉领域,并且已经取得了不错的效果。图1为近几年来CNN在ImageNet竞赛的表现,可以看到为了追求分类准确度,模型深度越来越深,模型复杂度也越来越高,如深度残差网络(ResNet)其层数已经多达152层。图0 CNN在ImageNet上的表现(来源:CVPR2017) However,在某些真实的应用场景转载 2018-01-25 11:11:10 · 1129 阅读 · 0 评论 -
faster rcnn 安装
标签: 5781编辑删除faster-rcnn提出论文: 《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》faster-rcnn 的算法详解可看这篇博文(清晰易懂,良心博文!): http://blog.youkuaiyun.com/shenxiaol转载 2018-01-25 11:12:53 · 397 阅读 · 0 评论 -
语义分割 - Semantic Segmentation Papers
Semantic SegmentationTernausNet: U-Net with VGG11 Encoder Pre-Trained on ImageNet for Image Segmentation - 2018 - Kaggle[Paper][Code-PyTorch][Kaggle-Carvana Image Masking Challenge]Inverte转载 2018-01-25 15:47:06 · 1408 阅读 · 0 评论 -
GitHub项目:自然语言处理项目的相关干货整理
自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。本文作者为自然语言处理NLP初学者整理了一份庞大的自然语言处理项目领域的概览,包括了很多人工智能应用程序。选取的参考文献与资料都侧重于最新的深度学习研究成果。这些自然语言处理项目资源能为想要深入钻研一个自然语言处理NLP任务的人们提供一个良好的开端。自然语言处理项目的相关干货整理:指...转载 2018-07-27 11:46:59 · 3668 阅读 · 0 评论 -
opencv3.1+opencv_contrib编译错误问题解决
opencv3.1+opencv_contrib编译,cmake时候遇到下面问题:[plain] view plain copy print?CMake Error at /home/ubuntu/opencv3.1.0/opencv-3.1.0/cmake/OpenCVUtils.cmake:895 (file): file DOWNLOAD cannot open file for wr...原创 2018-05-23 18:21:09 · 3623 阅读 · 2 评论 -
使用自己的数据集训练 R-CNN
感谢作者:http://imzack.me/post/training-rcnn-using-my-own-dataset.html之前已经写了一篇安装 R-CNN 的文章了,现在就要使用自己的数据集训练 R-CNN 了。这篇文章记录了我用人脸数据集来训练 R-CNN,并且使用训练后的 R-CNN 模型检测出图片中的人脸的过程。注意:虽然下述内容在我的电脑上测试通过,但是由于此文章是我在做毕业设计...转载 2018-05-28 10:52:49 · 5263 阅读 · 0 评论 -
卷积与解卷积详解:tf中conv2d和conv2d_transpose详解
转载来自知乎,感谢作者:https://zhuanlan.zhihu.com/p/35549635最近在整理一些之前看tensorflow API的记在onenote中的笔记,然后发现在刚开始入门conv2d和conv2d_transpose两个API的时候,有点偏差,经过 @山隹木又 的指点得到最终的修正,在此感谢这位大佬的帮助。反卷积示例一反卷积示例2...转载 2018-05-22 15:42:30 · 4243 阅读 · 0 评论