
Deep Learning
会写BUG的鱼
奋斗小青年
展开
-
FCN网络的训练 -- 转自http://www.cnblogs.com/xuanxufeng/p/6243342.html
FCN网络的训练——以SIFT-Flow 数据集为例参考文章: http://blog.youkuaiyun.com/u013059662/article/details/52770198 caffe的安装配置,以及fcn的使用在我前边的文章当中都已经提及到了,这边不会再细讲。在下边的内容当中,我们来看看如何使用别人提供的数据集来训练自己的模型!在这篇文章之后,我计划还要再写如何fine-tu转载 2017-03-05 17:51:05 · 1582 阅读 · 1 评论 -
在笔记本windows上跑DCGAN----tensorflow-cpu
偶然的一次机会帮别人调程序,发现DCGAN在1080ti上占用显存只有600M左右,我想是不是可以笔记本上跑一下,本着玩一玩的心态,跑了一下,虽然很慢大约30s左右一张图片,但是可以当做练手的。先贴一下古董笔记本cpu。因为之前跑过一些python程序,opencv,svm,爬虫啥的,电脑上有python2.7和python3.6。DCGAN在python2.7和python3.6是都可以跑通的。...原创 2018-05-17 22:11:50 · 4128 阅读 · 7 评论 -
VALSE2018弱监督语义分割学习和总结2
STC: A Simple to Complex Framework for Weakly-supervised Semantic Segmentation魏云超(TPAMI 15)通过显著性物体检测的结果,自动地生成语义分割的标签。通过low-level vision得到的约束能够帮助我们在弱监督的语义分割的学习中,减少对人工标注的依赖。具体将这项工作所做的贡献总结如下:(1)提出了一个简单到复...原创 2018-05-11 14:36:45 · 5323 阅读 · 3 评论 -
VALSE2018弱监督语义分割学习和总结1
神经网络基础理解 神经网络里面不同层的卷积单元都扮演者视觉特征检测器的角色,从底层的视觉特征,比如边缘,角点;到高层的视觉模型,比如物体或者是场景。最后把这些东西综合起来进行分类。我们可以把最后一个卷积层看成是一个词典。每一张feature map对应检测输入中的一个单词,如果有,就在对应位置有高的激活值。后面的fc层其实就是利用这个词典进行分类。比如对于自行车分类器,他对于车轮,车把,车座...原创 2018-05-11 14:18:16 · 3881 阅读 · 4 评论 -
什么是MAP? 理解目标检测模型中的性能评估
导读】近日,机器学习工程师Tarang Shah发布一篇文章,探讨了机器学习中模型的度量指标的相关问题。本文首先介绍了机器学习中两个比较直观和常用的度量指标:精确度和召回率,然后详细讲解了目标检测领域最常用的度量指标——均值平均精度(mAP),并图解了给定边界框的正确性的度量标准IoU – 交并比。通过阅读本文,你将掌握机器学习模型,特别是目标检测领域的各种度量指标,这有助于在科研和项目中衡量你的...转载 2018-03-13 21:33:54 · 7618 阅读 · 0 评论 -
deformable convolutional networks
本文出自Bin的专栏:http://blog.youkuaiyun.com/xbinworldSTN创造性地在CNN结构中装入了一个可学习的仿射变换,目的是增加CNN的旋转、平移、缩放、剪裁性。为什么要做这个很奇怪的结构呢?原因还是因为CNN不够鲁棒,比如把一张图片颠倒一下,可能就不认识了(这里mark一下,提高CNN的泛化能力,值得继续花很大力气,STN是一个思路,读者以及我自己应该多想想,还有什么转载 2018-01-25 10:38:42 · 483 阅读 · 0 评论 -
Light-Head R-CNN: In Defense of Two-Stage Object Detector
论文笔记:https://zhuanlan.zhihu.com/p/33158548论文链接:https://arxiv.org/abs/1711.07264相关博客1 相关博客2这篇文章从题目上看就一目了然:捍卫two-stage object detector.我们知道Object detection分为两大门派:一类是two-sta转载 2018-01-23 10:10:17 · 977 阅读 · 0 评论 -
Capsule论文精译
胶囊间的动态路由 摘要 本论文所研究的胶囊意为一组神经元,其激活向量反映了某类特定实体(可能是整体也可能是部分)的表征。本论文使用激活向量的模长来描述实体存在的概率,用激活向量的方向表征对应实例的参数。某一层级的活跃胶囊通过矩阵变换做出预测,预测结果会用来给更高层级的胶囊提供实例参数。当多个预测值达成一致时,一个高层级的胶囊就会被激活。论文中展示了差异化训练的多层胶囊系统可以在翻译 2017-11-13 09:13:29 · 629 阅读 · 0 评论 -
语义分割(Semantic Segmentation )论文
搬运工,方便自己查阅!1.《Object Region Mining with Adversarial Erasing: A Simple Classification to Semantic Segmentation Approach》CVPR2017弱监督语义分割 http://blog.youkuaiyun.com/zhangjunhit/article/details/778951原创 2017-09-17 20:40:45 · 1481 阅读 · 0 评论 -
数据增强
深度学习中,为了避免出现过拟合(Overfitting),通常我们需要输入充足的数据量.本页面主要记录下常用的数据增强(Data Augmentation)变换方法.旋转 | 反射变换(Rotation/reflection): 随机旋转图像一定角度; 改变图像内容的朝向; 翻转变换(flip): 沿着水平或者垂直方向翻转图像; 缩放变换(zoom): 按照一定的比例放大或转载 2017-09-17 20:31:40 · 1020 阅读 · 0 评论 -
Semantic Segmentation via Structured Patch Prediction, Context CRF and Guidance CRF--论文阅读
1. Introduction语义分割是计算机视觉中一个基本但又困难的问题。与图像分类相比,它提供了对图像的像素化语义理解,通过对象类别、位置和形状来解析场景。深度网络在图像分类任务上取得了一系列突破[18,14,13]。卷积神经网络(CNN)由不同的深度和宽度所控制,提供了强大的模型,并综合多层次的特征和分类器嵌入像素间的统计和依赖关系正确的先验知识为防止过拟合最近在语义分割方面的进展主原创 2017-09-25 09:27:12 · 1047 阅读 · 0 评论 -
FCN ---caffe运行solve.py文件报错
File "solve.py", line 17, in caffe.set_mode_gpu()AttributeError: 'module' object has no attribute 'set_mode_gpu'终端打开solve.py所在目录,运行python -c "import caffe; print caffe.__file__",看输出目录,文原创 2017-06-13 16:58:48 · 2070 阅读 · 3 评论 -
VALSE2018图像解析与编辑
在参加会议之前,我一直认为语义分割这样像素级别的工作不是大家研究的热门。但是当我发现8号报告厅人数如此多的时候,我发现像素级别的工作做的人很多,自己只能站在最后排听大神们介绍他们的工作聆听这一年大家研究的趋势。虽然只是一只小弱鸡,但是开了眼界。个人觉得听到这个报告,他们的这个工作比较有趣,且接地气。之前并不知道语义分割与GAN会产生如此好玩的东西。图像理解与编辑涉及两方面的内容:首先获取图像中蕴含...原创 2018-05-14 17:48:52 · 648 阅读 · 0 评论