人工智障-优快云博客

原创【计算机视觉（四）】轮廓检测

前情提要上期结束前我们经过一些形态学处理得到了一幅这样的图（根据大家用的方法和参数设置可能会有出入）。可以看到即使经过一些腐蚀膨胀滤波的处理，图像依然有不少噪声，做计算机视觉就是这样的，没有银弹，只能不断的利用已有的信息逐步逼近我们想要的结果。本期内容本期介绍一些轮廓检测的方法，结合一些骚皮操作就能得到我们想要的车牌区域。一、矩形检测在OpenCV中检测矩形是用...

2018-07-13 07:03:08 3745 2

原创【计算机视觉（三）】形态学处理

前情提要上期我们提到了一个做抠车牌的案例，得到了一幅这样的图。但我们需要做进一步的细处理，让我们得到比较好的白色的车牌区域掩码。本期内容本期就是要处理这个问题，先来仔细分析这个问题。我们想要得到的区域是“辽H….”这一块白色的区域，这个区域有什么特点呢？第一、连贯，不像其他地方很多小小的白点；第二、整个区域近似一个矩形，不像车窗前那些区域，虽然连贯，但是形状比较蛇皮。这两个...

2018-07-10 05:40:01 1657

原创【计算机视觉（二）】常用颜色空间及其转换

前情提要在【计算机视觉（一）图像数据表示】中，我介绍了RGB和灰度两种颜色空间，并且介绍了像素的概念以及在程序上如何访问。本期内容接下来介绍从RGB到灰度的转换，以及两种我常用的颜色空间HSV和二值空间（严格来说属于灰度，只是只有0和255两个值）。一、RGB转灰度假如先不谈原理，RGB转灰度你会怎么做？先从我们知道的信息入手，RGB是三通道的，灰度只有一个通道，很自然...

2018-07-09 16:04:19 12777

原创【计算机视觉（一）】图像数据表示

数字图像是连续的光信号经过传感器的采样在空间域上的表达。一张图像是由一个包含若干个像素点的矩形框组成的，试着把一张图在“画图”软件中放大会有更直观的感受，下面是lena图放大后的效果。可以看到图像是由很多个小格子组成的，每个小格子都只有一种颜色，这是构成图像的最小单元——像素（pixel）。不同的像素值代表了不同的颜色，像素值的值域一般在0到255（包括）之间，也就是256个整数，因此可以...

2018-07-09 16:03:12 2039

原创 kNN在CIFAR10上的应用

1. 获取CIFAR10CIFAR10是一个10分类的图片数据集，主页在这里，作者使用python版本的数据集。2. 加载数据集在主页上已有加载数据集的代码，数据集分成了5个训练用的batch和1个test batch，每个batch有10000张32x32x3的图片，还有一个batches.meta文件装着label对应的名字。不妨贴出我的代码：def load_da

2017-07-24 00:38:56 3168 1

转载如何做好计算机视觉研究

http://www.tuicool.com/articles/AZNfuuE

2016-12-06 23:58:20 441

原创【Lecture2】线性代数复习

当我们处理图像的时候，实际上是在和矩阵打交道，因此自然少不了线性代数。详细的内容可以直接看飞飞的课件，如果不追求证明的话可以拿来就用。课件讲到了SVD，看了课件提到的if you're interested的资料，里面有SVD的几何解释，对于理解SVD大有裨益，在此处做点笔记。

2016-12-03 02:00:10 566

原创【Lecture1】Introduction

在你看到或看不到的地方存在着许多摄像头，可能你自己就有3、4个，但现阶段我们的摄像头都只是停留在看到的阶段，如果能让摄像头或者计算机获得理解图像甚至一定的想象能力，AI的梦想就离我们更进一步了。计算机视觉就是希望通过研究图像来让计算机获得类似于人的理解图像的能力，这个任务难在，我们人对图像的理解似乎是不假思索的，而且我们并不能对自身怎么理解图像作出很好的解释。

2016-12-02 02:15:53 399

人工智障的博客