
深度学习
机器视觉CV
计算机视觉爱好者,机器学习爱好者,具有丰富的算法实战经验。
展开
-
卷积神经网络之-GoogLeNet / Inception-v1
更多内容请关注『机器视觉CV』公众号简介论文地址:https://arxiv.org/abs/1409.4842Inception 是一个代号,是 Google 提出的一种深度卷积网络架构(PS:有一部电影的英文名就是它,中文名叫做盗梦空间)。Inception 的第一个版本也叫 GoogLeNet,在 2014 年 ILSVRC(ImageNet 大规模视觉识别竞赛)的图像分类竞赛提...原创 2020-01-28 16:24:42 · 788 阅读 · 0 评论 -
细粒度分类数据集汇总
CUB-200-2011 鸟类数据集:数据集地址:http://www.vision.caltech.edu/visipedia/CUB-200-2011.htmlCaltech-UCSD Birds-200-2011 (CUB-200-2011) 是 CUB-200 dataset 的一个扩充版本,每个类的图像数量大约增加两倍和新的部位注释。(1)类别数目: 200(2)图像总数目: ...原创 2020-01-05 19:52:17 · 9039 阅读 · 0 评论 -
卷积神经网络之-ZFNet
更多内容请关注『机器视觉 CV』公众号原文地址说在前面(貌似江湖上有两篇 ZFNet 的论文,也即:Visualizing and Understanding Convolutional Networks )最新的请见论文地址:https://arxiv.org/pdf/1311.2901.pdf这两篇还是有细微差别的,比如以下两张图,版本一的 (e) 没有在论文展示出来,但是却在题注上出...原创 2020-01-05 15:04:42 · 723 阅读 · 0 评论 -
卷积神经网络之-VGGNet
更多内容请关注『机器视觉 CV』公众号原文地址VGGNet 是由牛津大学视觉几何小组(Visual Geometry Group, VGG)提出的一种深层卷积网络结构,他们以7.32%的错误率赢得了2014年ILSVRC分类任务的亚军(冠军由GoogLeNet以6.65%的错误率夺得)和25.32%的错误率夺得定位任务(Localization)的第一名(GoogLeNet错误率为26.44%...原创 2020-01-05 15:03:47 · 647 阅读 · 0 评论 -
卷积神经网络之-NiN网络(Network In Network)
更多内容请关注『机器视觉 CV』公众号原文地址简介Network In Network 是发表于 2014 年 ICLR 的一篇 paper。当前被引了 3298 次。这篇文章采用较少参数就取得了 Alexnet 的效果,Alexnet 参数大小为 230M,而 Network In Network 仅为 29M,这篇 paper 主要两大亮点:mlpconv (multilayer per...原创 2020-01-05 15:02:25 · 1242 阅读 · 0 评论 -
卷积神经网络之-Lenet
更多内容请关注『机器视觉CV』公众号原文地址前言Lenet 是一系列网络的合称,包括 Lenet1 - Lenet5,由 Yann LeCun 等人在1990 年《Handwritten Digit Recognition with a Back-Propagation Network》中提出,是卷积神经网络的 HelloWorld。Lenet5Lenet 的最终版本是 Lenet5,是...原创 2020-01-05 15:00:52 · 436 阅读 · 0 评论 -
卷积神经网络之-Alexnet
更多内容请关注『机器视觉CV』公众号原文地址论文地址:https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf2012年, AlexNet横空出世。这个模型的名字来源于论⽂第⼀作者的姓名Alex Krizhevsky [1]。AlexNet使⽤了...原创 2020-01-05 14:59:27 · 798 阅读 · 0 评论 -
人脸表情识别从 0 到部署,猜猜『轮到你了』的微笑狼人到底是谁!
更多内容请关注『机器视觉CV』公众号,提供免费GPU本文实现了从项目调研、数据收集、数据预处理、深度卷积神经网络训练再到服务器部署,实现了一个人脸表情识别的小项目,非常适合一直在学习,但是找不到合适的练手项目的同学。0 项目成果先展示一下我的结果。我们测试的图片当然是当前最热的 nihongo 电视剧『轮到你了』的 CP 二阶堂和黑岛了有兴趣的朋友可以扫码进行体验,会跳转到我的网站...原创 2019-12-25 22:12:51 · 748 阅读 · 0 评论 -
目标检测之 R-CNN 系列综述
上几期我们讲过目标检测 One-Stage 的代表 YOLOv3 本来这一期是打算写 SSD(One-Stage 的另一个代表) 的,发现 SSD 其中涉及的知识是从 R-CNN(Two-Stage)来的,故此。这一期我们就来理理 R-CNN 系列的部分知识点,同样,我们会分为 理论、体验和代码实战 三期来进行讲解,今天就是理论部分。在开始 R-CNN 系列之前,我们先引入几个概念,有助于后面的...原创 2019-12-08 20:36:54 · 663 阅读 · 0 评论 -
目标检测之选择性搜索算法实现(符动图演示)
定义选择性搜索是在对象检测中使用的区域提议算法。它的设计速度很快,召回率很高。它基于基于颜色,纹理,大小和形状兼容性的相似区域的分层分组计算。操作步骤首先使用 Felzenszwalb 和 Huttenlocher 基于图像的分割方法对分割的图像进行超像素的合并,合并彼此相似的相邻区域 ,合并的规则包括颜色相似度、纹理相似度、尺寸相似度、形状相似性等自下而上的方法创建了从较小细分到较...原创 2019-12-07 20:50:42 · 895 阅读 · 0 评论 -
动手学深度学习之 Pytorch 项目 | 附代码和电子书下载
这是什么书今天介绍一本书,动手学深度学习,原书作者:阿斯顿・张、李沐、扎卡里 C. 立顿、亚历山大 J. 斯莫拉。这本书原始的版本的代码是基于 MXNet 框架的。对于使用 TF 和 Pytorch 开发的学习者就比较不友好了,所幸,有大佬将其代码转成 Pytorch 版本,当然也有 TF 版本的(还在更新中),由于笔者使用的是 Pytorch 深度学习框架,当然就是介绍 Pytorch 版本的...原创 2019-12-07 13:06:46 · 2295 阅读 · 0 评论 -
R-CNN系列论文综述
本文首发自 优快云上几期我们讲过目标检测 One-Stage 的代表 YOLOv3 本来这一期是打算写 SSD(One-Stage 的另一个代表) 的,发现 SSD 其中涉及的知识是从 R-CNN(Two-Stage)来的,故此。这一期我们就来理理 R-CNN 系列的部分知识点,同样,我们会分为 理论、体验和代码实战 三期来进行讲解,今天就是理论部分。在开始 R-CNN 系列之前,我们先引入...原创 2019-12-04 15:43:39 · 1019 阅读 · 0 评论 -
目标检测代码实战篇
关注『机器视觉CV』领取免费 GPU 算力深度学习的三驾马车:数据、模型、算力。本文将从这三方面,实现 YOLO 目标检测,让自己的数据跑起来数据一个深度学习项目最好的初始状态是拥有漂亮的数据,但是一般情况下很难达到这种条件,往往需要根据自己项目的需求寻找相应的数据。对于目标检测项目来说,漂亮的数据应该是按照规范的标注。那么有数据却没有标注怎么办,我们推荐一款开源的标注工具 LabelIm...原创 2019-11-25 21:19:16 · 7086 阅读 · 4 评论 -
YOLO 目标检测实战项目『原理篇』
YOLOv1YOLOv1 创新:将整张图作为网络的输入,直接在输出层回归 bounding box 的位置和所属的类别(将对象检测作为一个回归问题)速度快,one stage detection 的开山之作速度快,one stage detection 的开山之作之前的目标检测方法需要先产生候选区再检测的方法虽然有相对较高的检测准确率,但运行速度较慢。YOLO 将识别与定位合二为...原创 2019-11-25 21:17:32 · 2842 阅读 · 0 评论 -
Pytorch 中的数据增强方式最全解释
更多内容请关注『机器视觉CV』公众号from torchvision import transformsfrom PIL import Imagefrom torchvision.transforms import functional as TFimport torch所有的变换[“Compose”, “ToTensor”, “ToPILImage”, “Normalize”, ...原创 2019-11-05 15:46:04 · 7754 阅读 · 0 评论