- 博客(107)
- 收藏
- 关注
原创 CS231n Lecture 11:图像分割与检测(各种R-CNN, YOLO, SSD)
CS231n Lecture 11:图像分割与检测@(人工智能和机器学习-default)图像的分割和检测任务有不同的粒度,我们首先明确一下有关概念:语义分割(Semantic Segmentation):将每个像素标注为某一类别,是一个分类问题。该任务不区分实例,即同一类别的不同实例都标为同一颜色(如下图中的两头牛);单物体检测:只识别图像中的一个物体,并标出bounding box...
2018-12-20 21:41:34
4437
原创 CS231n lecture 9:各大经典网络 AlexNet/VGG/GoogleNet/ResNet(上)
本篇将深入介绍当前的应用和研究工作中最火的几个CNN网络架构——AlexNet、VGGNet、GoogleNet和ResNet,它们都在ImageNet分类任务中有很好的表现。另外,本篇也会粗略介绍一些其他的架构。LeNet-5回顾我们先来回顾一下最基本的LeNet,它可以说是首个效果比较好的comNet。它使用了5x5的卷积核,stride为1。池化层卷积核是2x2的,stride为2。最后...
2018-10-13 22:05:03
4106
原创 图像质量评价之结构相似性SSIM(中)
在上一篇文章中,我们介绍了对图像质量进行评价的必要性、主观评价和客观评价的两种标准,以及设计符合人类直觉的评价标准的困难性和重要性。本来这篇文章想把我们的主角SSIM讲完,但是发现前面需要写的铺垫有点长hhh,所以本文是作为一个过渡,系统的讲解一下设计图像评价标准的过程和目前的缺点,SSIM的详细讲解将在下一篇文章中介绍(保证下一篇是最后一篇,别打我QAQ)提前预告一下,这一篇可能比较无聊==...
2018-10-11 18:00:46
6983
14
原创 图像质量评价之结构相似性SSIM(上)
这篇文章主要介绍对图像质量进行打分评价的一个很经典的指数——结构相似性(structual similarity, SSIM)。具体一点儿来说,图像在各种情况下都有可能失真,比如经过传输、压缩和缩放等等。图片变换之后,我们自然很想知道失真图像(distorted image)的质量如何,也就是要对它进行图像质量评价(image quality assessment)。注意这种评价应用很广泛,比如...
2018-10-06 10:27:33
18909
3
原创 Pytorch中常见的报错解决方案
本文用于记录所在pytorch所遇到过的运行时错误,持续更新。变量所在设备(CPU,GPU)不一致问题RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should be the same可能原因:现在假设代码要在GPU上运行,并且你已经进行my_model.to...
2018-10-03 20:05:03
12698
1
原创 Pytorch中的optimizer
与优化函数相关的部分在torch.optim模块中,其中包含了大部分现在已有的流行的优化方法。如何使用Optimizer要想使用optimizer,需要创建一个optimizer 对象,这个对象会保存当前状态,并根据梯度更新参数。怎样构造Optimizer要构造一个Optimizer,需要使用一个用来包含所有参数(Tensor形式)的iterable,把相关参数(如learni...
2018-09-14 21:28:48
35826
9
原创 一文读懂GAN, pix2pix, CycleGAN和pix2pixHD
本文翻译、总结自朱俊伟的线上报告,主要讲了如何用机器学习生成图片。来源:Games2018 Webinar 64期 :Siggraph 2018优秀博士论文报告人员信息主讲嘉宾姓名:朱俊彦(Jun-Yan Zhu) 现状:麻省理工学院博士后(PostDoc at MIT),计算机科学与人工智能实验室(Computer Science and Artificial In...
2018-09-14 04:42:30
68928
35
原创 Pytorch中的contiguous理解
最近遇到这个函数,但查的中文博客里的解释貌似不是很到位,这里翻译一下stackoverflow上的回答并加上自己的理解。在pytorch中,只有很少几个操作是不改变tensor的内容本身,而只是重新定义下标与元素的对应关系的。换句话说,这种操作不进行数据拷贝和数据的改变,变的是元数据。这些操作是: narrow(),view(),expand()和transpose()举个栗...
2018-09-12 15:35:43
36330
5
原创 认识色彩
本文为《图像处理中的数学修炼》一书第8章第一节的笔记按理说这些基础芝士应该挺熟的了,但再来看看还是有不少收获,尤其是眼睛那个部分。颜色与眼睛从产生上说,颜色是光作用与人眼的结果。人能感受的波长范围内的光波叫可见光。人眼中有两种感受颜色的细胞——锥状细胞和棒状细胞(也叫杆状细胞)。其中: 1. 锥状细胞有三种,每一种都有自己主要(注意不是唯一)能感受的颜色。 这三种分别能感受红色...
2018-09-09 15:39:07
1106
原创 网络可视媒体的智能计算-胡事民
本文为胡事民教授在山大做报告的笔记,现场见下图: 可视媒体是承载视觉信息的媒体类型,如图像、视频等,它具有网络化、海量和无序涌现等特征。可视媒体计算的研究意义可视媒体作为一种信息承载的介质,是用来表达语义信息的。那么就有一种介质与信息之间相互转化的问题。转化方向正反两种,举个栗子说明一下: 1. 可视媒体→→\rightarrow语义信息:比如看到画面,理解其中发生的事件、各主题之...
2018-09-09 14:16:42
2295
原创 从卷积到residual dense network: Convolution, ResNet, DenseNet and ResDenseNet解读
Convolution把各个*input feature maps分别经过一个kernel的卷积结果相加,得到一个* output feature map:Output feature map’s shapeConvolution layerConvolution layer的output feature map的shape与下列变量有关: - input featu...
2018-09-07 15:59:32
3385
原创 PyTorch中的PixelShuffle
感性认识一般的convolution操作会使feature map变小, 但当我们的stride=1r&lt;1stride=1r&lt;1\text{stride} = \frac{1}{r} < 1时,可以让卷积后的feature map变大,这个新的操作叫做sub-pixel convolution,具体原理可以看Real-Time Single Image and Video Sup...
2018-09-04 18:13:02
25655
7
原创 彻底搞懂Lab 颜色空间
本文参考wikipedia,并加入了自己的理解,有不对的地方多多指教~名称在开始之前,先明确一下Lab颜色空间(Lab color space)的名字: - Lab的全称是CIELAB,有时候也写成CIE L*a*b* - 这里的CIE代表International Commission on Illumination(国际照明委员会),它是一个关于光照、颜色等的国际权威组织。...
2018-09-04 00:53:31
115120
8
原创 PyTorch中的Dataset、Dataloader和_DataloaderIter
DatasetPytorch中数据集被抽象为一个抽象类torch.utils.data.Dataset,所有的数据集都应该继承这个类,并override以下两项: - __len__:代表样本数量。len(obj)等价于obj.__len__()。 - __getitem__:返回一条数据或一个样本。obj[index]等价于obj.__getitem__。建议将节奏的图片等高负载的操作放...
2018-08-30 19:16:05
11464
5
原创 Autograd:Pytorch 中的自动微分机制讲解
本文翻译、整理自Autograd官方documentation本文讲解了Autograd——pytorch中用于自动求微分的模块。下面的内容不需全部掌握,但读一下还有有助于加强理解的。在backward的过程中排除一部分子图Tensor的属性requires_grad代表它是否需要求梯度。注意除了这个属性除了可以被显式地设置性之外,还会被一个规则所定义:如果一个Tensor AAA...
2018-08-30 16:43:45
3223
原创 Ubuntu配置GPU版本pytorch环境(含NVIDIA驱动+Cuda+Cudnn)
本文更新于2018年8月概述步骤如下: 1. 安装Ubuntu 2. 安装NVIDIA 显卡驱动 2. 安装NVIDIA Cuda 3. 安装NVIDIA CuDNN 4. 安装GPU版本的PyTorch安装Ubuntu系统版本选择之前pytorch是不支持Windows的,现在貌似是支持了,但我们还是选择Ubuntu。注意Ubuntu的版本要与cuda兼容,...
2018-08-28 19:56:29
34533
4
原创 OpenGL中的异步缓存传输Asynchronous Buffer Transfers
本文介绍在OpenGL中buffer的异步传输,翻译、摘抄自OpenGL Insights Chapter 22。目前更新到第三节,待续(后面还没看懂)Terminology为了后文表述方便,现说明一些要使用术语: 1. GPU被称作device 2. 当调用OpenGL functions,相关命令会放入一个队列队列异步地依次执行,这个队列叫device command queu...
2018-07-24 16:19:13
2457
原创 LearnOpenGL.com笔记
* 本文用作学习learnOpenGL.com的备忘1. Hello TriangleRendering pipeline(蓝色部分可编写shader程序): some primitives: GL_LINES: Vertices 0 和1 是一条线,Vertices 2 and 3 是一条线,依次类推。GL_LINE_STRIP: 所有相邻点组成一条线。GL_LINE_LOO...
2018-06-12 15:35:54
736
原创 线性代数及其应用笔记
线代最近好多地方都要用到,然而之前学的太渣啦,这次复yu习xi一遍记一下,方便之后查阅~第1章 线性代数中的线性方程组线性方程组等价⇔⇔\Leftrightarrow解集相同⇔⇔\Leftrightarrow增广矩阵行等价线性方程组的解:null/one/infinite线性方程组相容:有解(one/infinite)行初等变换: 倍加:加上另一行的倍数对换:两行互换倍乘:一...
2018-05-27 01:00:21
7566
原创 [kuangbin带你飞]专题十六A-K KMP & 扩展KMP & Manacher 题目分析
[kuangbin带你飞]专题十六 KMP & 扩展KMP & Manacher 题目分析,含源码
2017-11-13 02:03:15
503
原创 Sublime Text 3安装SublimeCodeIntel并配置JavaScript自动补全
Sublime Text 3安装SublimeCodeIntel并配置JavaScript自动补全
2017-10-30 23:04:27
4155
1
原创 CS231n Convolutional Neural Networks for Visual Recognition
CS231n CNN图像分类 笔记
2017-10-19 23:33:25
463
原创 李宏毅机器学习 10.卷积神经网络 笔记
李宏毅机器学习-10.卷积神经网络使用CNN处理图像的原因:性质一:Some patterns are much smaller than the whole image(如鸟的图像中有鸟嘴这个小pattern). A neuron does not have to see the whole image to discover the pattern. Connecting to small r
2017-09-26 07:28:27
1883
原创 机器学习-周志华-第五章笔记 CNN
Chapter 5 神经网络-机器学习-周志华5.1神经元模型神经网络:具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。神经元模型:一个神经元收到的刺激超过阈值(threshold/bias),它就会被激活。概括为M-P神经元模型:n个带权输入→\rightarrow与threshold比较→\rightarrow激活函数处理产生输出。
2017-09-26 07:22:38
1608
原创 [树形dp][trie]cf856B Similar Words
@(ACM题目)[字符串, 图论, trie, 染色]Description Let us call a non-empty sequence of lowercase English letters a word. Prefix of a word x is a word y that can be obtained from x by removing zero or more last l
2017-09-13 07:20:28
677
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人