
Deep Learning
文章平均质量分 88
ayanwan
这个作者很懒,什么都没留下…
展开
-
Tesseract-OCR编译及ViewerDebugging使用
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。一、简介 Tesseract-OCR依赖图像库Leptonica。 Leptonica是一个开源的图像处理和图像分析库。它主要包括的操作有:位图操作、仿射变换、形态学操作、连通区域填充、图像变换及像素掩模、融合、增强、算术运算等操作。原创 2017-03-18 19:41:41 · 2570 阅读 · 9 评论 -
【pytorch】迁移学习
在很多场合中,没有必要从头开始训练整个卷积网络(随机初始化参数),因为没有足够丰富的数据集,而且训练也是非常耗时、耗资源的过程。通常,采用pretrain a ConvNet的方式,然后用ConvNet作为初始化或特征提取器。有两种迁移学习,对应着不同的应用场景。微调ConvNet:使用已有的model参数代替随机初始化参数进行训练。ConvNet做为特征提取器:我们需要冻结所原创 2017-06-18 20:33:44 · 5041 阅读 · 1 评论 -
【pytorch】模型的搭建保存加载
使用pytorch进行网络模型的搭建、保存与加载,是非常快速、方便的。搭建ConvNet所有的网络都要继承torch.nn.Module,然后在构造函数中使用torch.nn中的提供的接口定义layer的属性,最后,在forward函数中将各个layer连接起来。下面,以LeNet为例:class LeNet(nn.Module): def __init__(self):原创 2017-06-17 10:53:05 · 24505 阅读 · 3 评论 -
【pytorch】训练集的读取
pytorch读取训练集是非常便捷的,只需要使用到2个类:(1)torch.utils.data.Dataset(2)torch.utils.data.DataLoader常用数据集的读取1、torchvision.datasets的使用对于常用数据集,可以使用torchvision.datasets直接进行读取。torchvision.dataset是torch.utils.原创 2017-06-16 22:28:52 · 17151 阅读 · 2 评论 -
【pytorch】图像基本操作
为了方便进行数据的操作,pytorch团队提供了一个torchvision.transforms包,我们可以用transforms进行以下操作:PIL.Image/numpy.ndarray与Tensor的相互转化;归一化;对PIL.Image进行裁剪、缩放等操作。通常,在使用torchvision.transforms,我们通常使用transforms.Compose将t原创 2017-06-14 20:01:37 · 24491 阅读 · 2 评论 -
caffe-windows编译
# 环境:windows 10\CUDA8.0\cuDNN-v5.1\VS20131、GPU计算环境(1)下载并安装CUDA8.0;(2)下载cuDNN。载后解压会有三个文件夹bin、include、lib。将这三个文件夹复制到cuda的安装目录中:\NVIDIA GPU ComputingToolkit\CUDA\v8.5。(cuda的安装目录中也有这三个文件夹,将这三个原创 2017-03-06 16:28:00 · 2433 阅读 · 0 评论 -
pytorch使用总结
torch.Tensor - 一个多维数组autograd.Variable - 改变Tensor并且记录下来操作的历史记录。和Tensor拥有相同的API,以及backward()的一些API。同时包含着和张量相关的梯度。nn.Module - 神经网络模块。便捷的数据封装,能够将运算移往GPU,还包括一些输入输出的东西。nn.Parameter - 一种变量,当将任何值赋予Modu原创 2017-06-03 10:48:26 · 9732 阅读 · 4 评论