
深度学习
文章平均质量分 72
AI之路
机器学习,深度学习,计算机视觉算法爱好者
展开
-
ATSS 算法——揭秘anchor-free和anchor-based算法差异
论文:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection论文链接:https://arxiv.org/abs/1912.02424代码链接:https://github.com/sfzhang15/ATSS2018年发表的CornerNet...原创 2020-01-01 19:11:58 · 10790 阅读 · 2 评论 -
ACNet——涨点且不增加耗时的技巧
论文:ACNet: Strengthening the Kernel Skeletons for Powerful CNN via AsymmetricConvolution Blocks论文链接:https://arxiv.org/abs/1908.03930代码链接:https://github.com/DingXiaoH/ACNet图像分类领域,从VGG到DenseNet那几年是比较...原创 2020-01-09 21:44:46 · 7008 阅读 · 5 评论 -
softmax,softmax-loss,BP的解释
softmax,softmax-loss,BP的解释转载 2017-05-04 20:32:50 · 28271 阅读 · 6 评论 -
论文笔记 understanding deep learning requires rethinking generalization
ICLR understanding deep learning requires rethinking generalization原创 2017-05-04 21:11:45 · 7146 阅读 · 0 评论 -
人工智能相关领域的国际顶尖会议介绍
CVPY NIPS ICLR ICCV原创 2017-03-31 11:29:08 · 7275 阅读 · 0 评论 -
R-FCN算法的Caffe实现
本博文介绍如何在Caffe上实现R-FCN,关于R-FN的算法讲解和Caffe代码详解可以参考另外一篇博客:Object Detection算法——R-FCN算法及Caffe代码详解git地址:https://github.com/Orpine/py-R-FCN 基本上按照这个git上的readme.md的流程进行并假设你本机的Caffe本来就可以正常使用,接下来详细讲解可能会遇到的坑:1、先从g原创 2017-06-03 10:48:58 · 3271 阅读 · 3 评论 -
DDR(Deep Direct Regression )算法详解
论文:Deep Direct regression for multi-oriented scene text detection 论文链接:https://arxiv.org/pdf/1703.08289.pdf要解决的问题: 传统的object detection算法比如Faster-RCNN,SSD和YOLO可以应用在horizontal scene texts detection上,而且原创 2017-05-25 19:42:30 · 4715 阅读 · 3 评论 -
OHEM算法的Caffe实现
这篇博文介绍如何用OHEM算法训练数据和测试数据。因为OHEM算法是对Fast RCNN的改造,所以Caffe代码的编译和Fast(er) RCNN基本类似。OHEM算法及Caffe代码的讲解可以参考另外一篇博客:OHEM算法及Caffe代码详解代码的github地址:https://github.com/abhi2610/ohem1、拉取项目git clone --recursive https:原创 2017-06-13 22:46:33 · 4301 阅读 · 2 评论 -
A-Fast-RCNN算法的Caffe实现
A-Fast-RCNN算法来自论文:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection。项目的git地址:https://github.com/xiaolonw/adversarial-frcnn因为git上对于如何训练模型,如何测试数据介绍得比较简单,因此自己亲自试验了一下,并记录下过程。1、从Faste原创 2017-06-11 22:28:25 · 5457 阅读 · 11 评论 -
OHEM算法及Caffe代码详解
这是CVPR2016的一篇论文,用于目标检测,本篇博文先介绍这个算法,然后介绍其Caffe代码。论文:Training Region-based Object Detectors with Online Hard Example Mining 论文链接:https://arxiv.org/abs/1604.03540算法概述:OHEM(online hard example miniing)算法的原创 2017-06-12 23:25:27 · 15048 阅读 · 8 评论 -
FPN(feature pyramid networks)算法讲解
这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享。 论文:feature pyramid networks for object detection 论文链接:https://arxiv.org/abs/1612.03144论文概述: 作者提出的多尺度的object detection算法:FPN(feature pyramid networks)。原来多数的原创 2017-06-06 22:41:15 · 198848 阅读 · 69 评论 -
Fast RCNN算法详解
这篇博文来介绍Fast RCNN,是RCNN算法的升级版。RCNN系列算法看完后才写的这篇博客,相信初学者会比较容易这篇算法。论文:Fast R-CNN 论文链接解决的问题: 之所以提出Fast R-CNN,主要是因为R-CNN存在以下几个问题:1、训练分多步。通过上一篇博文我们知道R-CNN的训练先要fine tuning一个预训练的网络,然后针对每个类别都训练一个SVM分类器,最后还要用re原创 2017-06-03 12:14:46 · 119797 阅读 · 21 评论 -
R-CNN算法详解
这是一篇比较早的Object Detection算法,发表在2014年的CVPR,也是R-CNN系列算法的开山之作,网上可以搜到很多相关的博客讲解,本篇博文没有按论文顺序来讲述,而是结合自己经验来看这个算法,希望给初学者一个直观的感受,细节方面不需要太纠结,因为很多部分在后来的算法中都改进了。论文:Rich feature hierarchies for accurate object detect原创 2017-06-03 11:24:40 · 22265 阅读 · 6 评论 -
深度学习算法工程经验
本篇博文主要介绍深度学习算法的一些经验,主要参考Andrew NG的新书《Machine Learning Yearning》,目前出到第14章,基本上都是介绍深度学习在工程上的应用,全书没有数学公式,可以说是干货满满,非常值得一读!接下来我将结合自己的项目经历,以这本书为顺序介绍自己的心得体会。链接(1~12章): https://gallery.mailchimp.com/dc3a7ef4d7原创 2017-06-22 22:46:36 · 2751 阅读 · 0 评论 -
Xception算法详解
论文:Xception: Deep Learning with Depthwise Separable Convolutions 论文链接:https://arxiv.org/abs/1610.02357算法详解: Xception是google继Inception后提出的对Inception v3的另一种改进,主要是采用depthwise separable convolution来替换原来I原创 2017-07-15 08:40:50 · 76500 阅读 · 17 评论 -
可变卷积(Deformable ConvNets)算法的MXNet实现
本文是可变卷积(Deformable ConvNets)算法的MXNet实现,MXNet是一种深度学习框架。一开始想熟悉这个框架的话可以跑跑官方网站上的MNIST或CITAR数据集等等,本篇博文更进一步,主要是通过这个算法实例来熟悉MXNet框架的使用。博文主要分三大部,第一部分是拉取MXNet项目,第二部分是拉取你的算法项目和运行demo,第三部分是自己训练模型。接下来假设你的所有操作都是在$Mx原创 2017-06-16 22:37:54 · 9770 阅读 · 16 评论 -
Faster R-CNN 的Caffe实现
Faster R-CNN是一种object detection算法,这里记录下Faster R-CNN的Caffe实现。 git地址:https://github.com/rbgirshick/py-faster-rcnn这里主要讲两个方面内容,一方面是从无到有如何成功运行demo(假设你的Caffe已经可以用),另一方面是如何自己训练模型,可以用自己的数据,也可以是本文的VOC数据集。一、运行d原创 2017-05-24 19:49:21 · 21804 阅读 · 17 评论 -
损失函数改进之Large-Margin Softmax Loss
最近几年网络效果的提升除了改变网络结构外,还有一群人在研究损失层的改进,这篇博文要介绍的就是较为新颖的Large-Margin softmax loss(L-softmax loss)。Large-Margin softmax loss来自ICML2016的论文:Large-Margin Softmax Loss for Convolutional Neural Networks 论文链接:htt原创 2017-08-08 08:23:24 · 33782 阅读 · 12 评论 -
SSD(single shot multibox detector)算法及Caffe代码详解
这篇博客主要介绍SSD算法,该算法是最近一年比较优秀的object detection算法,主要特点在于采用了特征融合。论文:SSD single shot multibox detector 论文链接:https://arxiv.org/abs/1512.02325算法概述:本文提出的SSD算法是一种直接预测bounding box的坐标和类别的object detection...原创 2017-05-31 22:55:49 · 97488 阅读 · 94 评论 -
损失函数改进之Center Loss
最近几年网络效果的提升除了改变网络结构外,还有一群人在研究损失层的改进,这篇博文要介绍的就是较为新颖的center loss。center loss来自ECCV2016的一篇论文:A Discriminative Feature Learning Approach for Deep Face Recognition。 论文链接:http://ydwen.github.io/papers/WenEC原创 2017-08-09 08:00:37 · 82376 阅读 · 20 评论 -
CVPR2017-如何在无标签数据集上训练模型
论文:Fine-tuning Convolutional Neural Networks for Biomedical Image Analysis: Actively and Incrementally 论文链接:http://openaccess.thecvf.com/content_cvpr_2017/papers/Zhou_Fine-Tuning_Convolutional_Neural_原创 2017-08-09 08:33:48 · 21228 阅读 · 4 评论 -
Memory-Efficient Implementation of DenseNets
论文:Memory-Efficient Implementation of DenseNets 论文链接:https://arxiv.org/abs/1707.06990这篇技术报告旨在改进DenseNet模型占用显存较大的问题。DenseNet是一个全新的模型,对于特征的极致利用可以提高模型的表现能力,同时由于生成大量的intermediate feature(中间特征),因此存储这些inter原创 2017-08-17 07:36:43 · 5051 阅读 · 0 评论 -
卷积神经网络系列之softmax,softmax loss和cross entropy的讲解
我们知道卷积神经网络(CNN)在图像领域的应用已经非常广泛了,一般一个CNN网络主要包含卷积层,池化层(pooling),全连接层,损失层等。虽然现在已经开源了很多深度学习框架(比如MxNet,Caffe等),训练一个模型变得非常简单,但是你对这些层具体是怎么实现的了解吗?你对softmax,softmax loss,cross entropy了解吗?相信很多人不一定清楚。虽然网上的资料很多,但是...原创 2017-08-17 07:47:51 · 181599 阅读 · 92 评论 -
损失函数改进方法总览
这篇博客主要列个引导表,简单介绍在深度学习算法中损失函数可以改进的方向,并给出详细介绍的博客链接,会不断补充。1、Large Marge Softmax Loss ICML2016提出的Large Marge Softmax Loss(L-softmax)通过在传统的softmax loss公式中添加参数m,加大了学习的难度,逼迫模型不断学习更具区分性的特征,从而使得类间距离更大,类内距离更小。核原创 2017-08-09 08:11:19 · 14106 阅读 · 1 评论 -
Focal Loss
论文:Focal Loss for Dense Object Detection 论文链接:https://arxiv.org/abs/1708.02002 优化版的MXNet实现:https://github.com/miraclewkf/FocalLoss-MXNetRBG和Kaiming大神的新作。 我们知道object detection的算法主要可以分为两大类:two-stag...原创 2017-08-10 08:21:11 · 100731 阅读 · 32 评论 -
GPU,CUDA,cuDNN的理解
我们知道做深度学习离不开GPU,不过一直以来对GPU和CPU的差别,CUDA以及cuDNN都不是很了解,所以找了些资料整理下,希望不仅可以帮助自己理解,也能够帮助到其他人理解。先来讲讲CPU和GPU的关系和差别吧。截图来自资料1(CUDA的官方文档):从上图可以看出GPU(图像处理器,Graphics Processing Unit)和CPU(中央处理器,Central Processing Uni原创 2017-08-17 20:29:37 · 106803 阅读 · 11 评论 -
深度学习框架的内存优化机制
这篇博文简单介绍下深度学习框架的内存优化方式,主要参考资料1,也就是MXNet的官方文档。内存优化方式主要包括:in-place operation和memory sharing两种,二者在本质上没有太大差别,同时这两种也是MxNet主要采用的内存优化方式,下面的截图均来自参考资料1,接下来基于计算图来讲解。1、in-place operation in-place operation的示意图如下原创 2017-08-17 21:03:27 · 3106 阅读 · 0 评论 -
Yolo 9000的darknet实现
代码的github地址:https://github.com/philipperemy/yolo-9000 我是Ubuntu 16.04系统1、拉取项目git clone --recursive https://github.com/philipperemy/yolo-9000.git因为我只能用http的地址,当然你可以跟github里面一样用git地址,结果都是一样的。默认拉取下来的项目名称是原创 2017-08-12 10:25:11 · 3861 阅读 · 1 评论 -
不需要预训练模型的检测算法—DSOD
论文:DSOD: Learning Deeply Supervised Object Detectors from Scratch 论文链接:https://arxiv.org/abs/1708.01241 caffe代码:https://github.com/szq0214/DSOD.这是一篇ICCV2017的文章,我觉得非常有意思,因为DSOD(Deeply Supervised Objec原创 2017-08-12 10:35:08 · 16888 阅读 · 18 评论 -
YOLO(You Only Look Once)算法详解
这篇博客主要介绍下YOLO v1算法(CVPR2016的文章)。YOLO是目前比较流行的object detection算法,速度快且结构简单,其他的object detection算法如faster RCNN,SSD相信大家也不陌生,以后有机会再介绍。另外提一下,这里算法部分介绍的是YOLO的第一个版本,而现在YOLO的官网上已经有YOLO v2的实现了,这个后续再介绍。论文名称:You o...原创 2017-05-21 22:58:44 · 159801 阅读 · 145 评论 -
SSD算法的改进版之R-SSD
论文:Enhancement of SSD by concatenating feature maps for object detection 论文链接:https://arxiv.org/abs/1705.09587算法详解: SSD算法在object detection领域的效果有目共睹,是proposal-free方面的代表算法之一,如果你对SSD算法不大熟悉,可以看看这篇博客:SSD(原创 2017-08-12 20:57:59 · 26324 阅读 · 17 评论 -
图像风格迁移-Image Style Transfer Using Convolutional Neural Networks
论文:Image Style Transfer Using Convolutional Neural Networks 论文链接图像风格迁移最近两年比较火,看起来也比较有趣,所以这两天闲暇时候看了一些文章了解了下其中的原理,特来分享。本篇博文要介绍的是2016年的CVPR论文,该文章用CNN网络来做图像风格迁移,作者是Gatys。Gatys在2015年的时候就发过一篇关于图像风格迁移的文章:A N原创 2017-07-29 07:35:06 · 22911 阅读 · 6 评论 -
Caffe用训练好的模型测试图片
这是一个python脚本,用训练好的caffemodel来测试图片,接下来直接上代码,里面有详细解释,大部分你要修改的只是路径,另外在这个脚本的基础上你可以根据自己的需要进行改动。需要的东西:训练好的caffemodel,deploy.prototxt(可以从你的train.prototxt修改得到),可以用的caffe,待测试的图像(比如jpg)import syscaffe_root='/yo原创 2017-08-23 08:03:37 · 8348 阅读 · 2 评论 -
MSDNet(Multi-Scale Dense Convolutional Networks)算法笔记
论文:Multi-Scale Dense Convolutional Networks for Efficient Prediction 论文链接:https://arxiv.org/abs/1703.09844 代码地址:https://github.com/gaohuang/MSDNetDenseNet的一作的作品,先来聊聊文章的出发点。对于分类网络的测试而言,有些输入图像是网络容易分类的,原创 2017-09-16 21:52:08 · 12428 阅读 · 6 评论 -
Weighted-Entropy-based Quantization for Deep Neural Networks
论文:Weighted-Entropy-based Quantization for Deep Neural Networks 论文链接这是CVPR2017的一篇文文章,是用基于weight entropy做深度学习模型quantization的模型压缩和加速算法。深度学习模型压缩和加速是近年来的一个研究热点,也是将深度学习模型部署到移动端的必经之路,一方面要压缩模型的大小,减少存储,另一方面要减原创 2017-09-01 08:13:59 · 3304 阅读 · 1 评论 -
ThiNet算法详解
论文:ThiNet: A Filter Level Pruning Method for Deep Neural Network Compression 论文链接:https://arxiv.org/abs/1707.06342prune(剪枝)是深度学习模型压缩和加速的重要方法。ThiNet是ICCV2017的文章,主要通过prune方式达到模型压缩和加速,prune以filter(卷积核)为单原创 2017-09-01 08:04:48 · 9936 阅读 · 6 评论 -
XNOR-Net算法详解
论文:XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks 链接:https://arxiv.org/abs/1603.05279 代码地址:http://allenai.org/plato/xnornet模型压缩和加速是深度学习算法应用在移动端必须要解决的问题,也是近年来的研究热点,这篇文章就是原创 2017-08-31 08:27:51 · 23670 阅读 · 11 评论 -
DSD(Dense-Sparse-Dense Training)算法详解
论文:DSD: Dense-Sparse-Dense Training for Deep Neural Networks 论文链接:https://arxiv.org/pdf/1607.04381.pdf 模型下载地址:https://songhan.github.io/DSD.这是Song Han发在ICLR2017上的文章,我们知道Song Han的研究领域主要是模型压缩,模型加速等,但是这原创 2017-09-03 10:14:47 · 8169 阅读 · 1 评论 -
YOLO算法的Caffe实现
YOLO算法有多种实现版本,论文中的作者的实现是在darknet框架下,可以参考链接:点击打开链接,darknet上已经更新到YOLO V2版本了。这里主要讲Caffe版本的YOLO实现,主要采用yeahkun写的:点击打开链接,基本按照这个git里面的readme进行,但是因为整个流程操作起来步骤较多,所以将自己在调试过程中遇到的小问题记录如下:大致步骤包括:1、下载VOC数据集。2、生原创 2017-05-19 19:02:50 · 25784 阅读 · 46 评论 -
YOLO v2算法详解
论文: YOLO9000:Better,Faster,Stronger 论文链接:https://arxiv.org/abs/1612.08242YOLO9000是CVPR2017的最佳论文提名。首先讲一下这篇文章一共介绍了YOLO v2和YOLO9000两个模型,二者略有不同。前者主要是YOLO的升级版(关于YOLO v1的介绍可以参考:YOLO v1算法详解),后者的主要检测网络也是YO...原创 2017-09-13 08:25:01 · 63953 阅读 · 53 评论