
计算机视觉
LiAnG小炜
Everything became much clearer when I started writing code.
展开
-
计算机视觉(二):图像检索以及基于图像描述符的搜索
1 - 引言原创 2018-12-27 10:46:46 · 1101 阅读 · 0 评论 -
计算机视觉(十二):Mask R-CNN
1 - 引言Mask R-CNN是在Faster R-CNN架构为基础上改进的一种目标检测架构,并且能够有效的完成高质量的语义分割原创 2019-03-18 19:29:05 · 2345 阅读 · 0 评论 -
计算机视觉(十一):目标检测算法:R-CNN、Fast R-CNN、Faster R-CNN
123原创 2019-02-22 10:17:59 · 1900 阅读 · 0 评论 -
计算机视觉(十):梯度下降优化算法
1 - 引言我们知道,神经网络使用的是梯度下降来最小化损失函数,来获得最优解,因此如何使用更好的梯度下降算法,关系到我们神经网络的训练速度和准确率,因此,如何利用算得的损失函数及其关于模型参数的梯度,就成为了对神经网络最优化的核心问题。我们在optim.py文件中构建这些梯度下降算法之前,我们使用的是随机梯度下降(stochastic gradient descent)def sgd(w,...原创 2019-01-22 15:16:32 · 900 阅读 · 0 评论 -
计算机视觉(九):神经网络的完善与模块化
1 - 引言之前,我们已经实现了神经网络基本的功能,现在,要将神经网络的搭建用模块化的思想组建起来,让程序更加富有可扩展性和可读性,然后学习一些非常常用的神经网络优化算法,让我们的训练更加的快速,并且准确率进一步提高。下面就让我们开始吧2 - 模块化构造神经网络2.1 - 仿射层和激活层的前向传播一个神经元,由这两个部分构成仿射层(Affine Layer)神经网络中的一个全连接层。...原创 2019-01-22 10:56:12 · 1013 阅读 · 0 评论 -
计算机视觉(六):使用Softmax分类Cifar-10数据集
1 - 引言这次,我们将使用Softmax来分类Cifar-10,过程其实很之前使用的SVM过程差不多,主要区别是在于损失函数的不同,而且Softmax分类器输出的结果是输入样本在不同类别上的概率值大小,Softmax分类器也叫多项Logistic回归线性模型:y=Wxy=Wxy=WxSoftmax模型:Si=eyi∑jeyjS_i=\frac{e^{y_i}}{\sum_{j}e^{y...原创 2019-01-09 12:03:49 · 2919 阅读 · 2 评论 -
计算机视觉(五):使用SVM分类Cifar-10数据集
1 - 引言之前我们使用了K-NN对Cifar-10数据集进行了图片分类,正确率只有不到30%,但是还是比10%高的[手动滑稽],这次我们将学习使用SVM分类器来对Cafi-10数据集实现分类,但是正确率应该也不会很高要想继续提高正确率,就要对图像进行预处理和特征的选取工作,而不是用整张图片进行识别。从计算机视觉发展的角度来将,在深度学习出来之前,传统的图像识别方法一直都是使用特征选取+分类器...原创 2019-01-08 11:25:01 · 6875 阅读 · 1 评论 -
计算机视觉(八):提取Cifar-10数据集的HOG、HSV特征并使用神经网络进行分类
1 - 引言之前我们都是将整张图片输入进行分类,要想进一步提升准确率,我们就必须提取出图片更容易区分的特征,再将这些特征当做特征向量进行分类。在之前我们学了一些常用的图像特征,在这次实验中,我们使用了两种特征梯度方向直方图(HOG)颜色直方图(HSV)为什么选用这两种特征呢?应为HOG捕捉到的是图像的纹理特征,而忽略了颜色信息,颜色直方图会表示图像的颜色特征而忽略了纹理特征,因此将这...原创 2019-01-13 11:40:02 · 5817 阅读 · 0 评论 -
计算机视觉(七):构建两层的神经网络来分类Cifar-10数据集
1 - 引言之前我们学习了神经网络的理论知识,现在我们要自己搭建一个结构为如下图所示的神经网络,对Cifar-10数据集进行分类前向传播比较简单,就不在赘述反向传播需要注意的是,softmax的反向传播与之前写的softmax代码一样。神经网络内部的反向传播权重偏导就是前面的系数,偏置的导为1,所以就是传播输入的累加和,ReLU函数在反向传播时,小于零的均为0,大于零的不变根据求导过程可...原创 2019-01-11 11:47:04 · 2384 阅读 · 0 评论 -
计算机视觉(一):人脸检测和识别
1 - 引言之前我们学习了机器学习和数字图像处理的相关知识,了解了基本的概念理论和OpenCV和TensorFlow框架的使用,现在我们可以结合这些知识与工具写出属于我们自己的计算机视觉项目,本文主要介绍了如何使用OpenCV提供的函数来构建一个人脸识别和检测的应用2 - Haar级联的概念我们知道提取出图像数据的细节特征对产生稳定分类结果和跟踪结果很有用,两个图像的相似程度可以通过他们对应...原创 2018-12-26 11:28:13 · 4201 阅读 · 1 评论 -
计算机视觉(四):使用K-NN分类器对CIFAR-10进行分类
1 - 引言之前我们学习了KNN分类器的原理,现在让我们将KNN分类器应用在计算机视觉中,学习如何使用这个算法来进行图片分类。2 - 准备工作创建项目结构如图所示在datasets文件中下载数据集Cifar-10k_nearest_neighbor.py代码如下:import numpy as npfrom collections import Counterclass K...原创 2019-01-05 11:53:37 · 3189 阅读 · 3 评论 -
计算机视觉(三):目标检测与识别
1 - 引言目标检测和识别,是计算机视觉最常见的挑战之一。目标检测和识别的区别在于:目标检测是用来确定图像的某个区域是否含有要识别的对象,而识别是程序识别对象的能力。识别通常只处理已检测到对象的区域。在计算机视觉中有很多目标检测和识别的技术梯度直方图(Histogram of Oriented Gradient, HOG)图像金字塔(image pyramid)滑动窗口(slidin...原创 2018-12-27 16:42:20 · 30244 阅读 · 3 评论 -
目标检测评价指标
1 - 引言在衡量一个目标检测的模型时,有许多的标价指标可以帮助我们评价一个模型的好坏。在这里总结一下准确率 (Accuracy),混淆矩阵 (Confusion Matrix),精确率(Precision),召回率(Recall),平均正确率(AP),mean Average Precision(mAP),交除并(IoU),ROC + AUC,非极大值抑制(NMS)。2 - 准确率 (Ac...转载 2019-03-13 17:10:02 · 1099 阅读 · 0 评论