
计算机视觉
小珈猫
这个作者很懒,什么都没留下…
展开
-
【机器视觉】(北邮版)卷积神经网络
卷积神经网络中, 卷积核可以按照指定的间隔进行卷积操作,这个间隔就是卷积步长。原创 2020-12-09 15:04:43 · 246 阅读 · 0 评论 -
【机器视觉】(北邮版)卷积,图像降噪,边缘提取,纹理表示
梯度是链式法则,连乘–》容易造成梯度消失Dropout:随机失活~卷积与图像去噪对一个像素点做卷积–》推广到所有像素点卷积核:注意:卷积核需要先翻转才能做滤波,不然不叫做卷积,叫滤波卷积性质:1、叠加性2、平移不变性边界填充:不填充会导致图像边界小一圈0填充:Zero-padding其他填充方法:拉伸,镜像卷积操作后的图像要小于输入时图像,通过边界填充,我们可以实现卷积前后图像的尺寸不变;卷积示例:单位脉冲:无变化平滑:锐化:原图-平滑=细节原图+细节=锐化原创 2020-12-02 23:37:57 · 948 阅读 · 0 评论 -
【机器视觉】(北邮版)图像分割
语义分割它是像素级的概念,而实例分割还要进一步区分哪个是哪个,需要进一步地划分。语义分割:不区分实例,只考虑像素类别!语义分割思路:滑动窗口问题: 效率太低! 重叠区域的特征反复被计算解决方案:全卷积网络让整个网络只包含卷积层,一次性输出所有吧像素的类别预测~最后一层为C类,即CHW问题:处理过程中一直保持原始分辨率,对于显存的需求会非常庞大好处:减少运算量,加快运算速度~改进:先下采样再上采样~FCNet下采样:pooling, stried convolution上采样:近邻法,原创 2020-11-20 10:22:14 · 418 阅读 · 0 评论 -
【机器视觉】(北邮版)全连接神经网络(多层感知机)
全连接神经网络级联多个变换来实现输入到输出的映射注意:非线性操作是不可以去掉w2融合这多个模版的匹配结果来实现最终类别打分全联接神经网络的描述能力更强。因为调整 " 行数等于增加模板个数,分类器有机会学到两个不同方向的马的模板。线性可分——至少存在一个线性分界面能把两类样本没有错误的分开。两层全连接网络f=W2max(0,W1x+b1)+b2f=W_2 max(0,W_1x+b_1)+b_2f=W2max(0,W1x+b1)+b2N层全连接神经网络——除输入层之外其他层的数量为.原创 2020-10-22 14:25:38 · 1444 阅读 · 0 评论 -
【机器视觉】(北邮版)线性分类器
总结图图像表示图像类型:3种大多数图像分类算法要求输入向量将图像转换成向量的方法有很多:最简单的直接转换为矩阵分类模型线性分类器:特点:1.形式简单、易于理解2.通过层级结构(神经网络)或者高维映射(支撑向量机)可以形成功能强大的非线性模型大样本:神经网络最有效小样本:支撑向量机最有效定义:线性分类器是一种线性映射,将输入的图像特征映射为类别分数线性分类器的矩阵表示:问题:CIFAR10 数据集分类任务的分类器, x,w,b,f的维度是多少?回答:CIFAR10有10原创 2020-10-11 18:33:30 · 632 阅读 · 0 评论 -
【机器视觉】(北邮版)图像分类
图像分类什么是图像分类任务,它有哪些应用场合?图像分类任务有哪些难点?基于规则的方法是否可行?什么是数据驱动的图像分类范式?常用的分类任务评价指标是什么?什么是图像分类任务?图像分类任务是计算机视觉中的核心任务,其目标是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。图像分类任务有哪些难点呢?跨越“语义鸿沟”建立像素到语义的映射基于规则的分类方法是否可行?通过硬编码的方法识别猫或其他类,是一件很困难的事。数据驱动的图像分类方法具体来看:图像表示原创 2020-10-11 16:13:31 · 561 阅读 · 0 评论 -
【机器视觉】(北邮版)前言
课件下载地址:https://github.com/CV-xueba/A02_cvclass_cv-dl/blob/master/原创 2020-10-10 17:13:05 · 236 阅读 · 0 评论 -
【CV视觉基础】直方图与傅里叶变换(python实现)
直方图cv2.calcHist(images,channels,mask,histSize,ranges)images: 原图像图像格式为 uint8 或 float32。当传入函数时应 用中括号 [] 括来例如[img]channels: 同样用中括号括来它会告函数我们统幅图 像的直方图。如果入图像是灰度图它的值就是 0;如果是彩色图像 的传入的参数可以是 0,1,2]它们分别对应着 BGR。mask: 掩模图像。统整幅图像的直方图就把它为 None。但是如 果你想统图像某一分的直方图的你就制作一原创 2020-09-27 20:02:47 · 250 阅读 · 0 评论 -
【CV视觉基础】图像金字塔与轮廓检测,模板匹配(python实现)
图像金字塔高斯金字塔高斯金字塔:向下采样方法(缩小) 方向向上,往塔尖走!!!高斯金字塔:向上采样方法(放大)代码:上下采样都可以重复进行下去,可以嵌套!一个图像先上后下和原图像不一样,因为有经过信息的填充,如下图,左边为原始的,右边为uo-down融合的结果:拉普拉斯金字塔图像轮廓轮廓是整体边缘是零零散散的cv2.findContours(img,mode,method)mode:轮廓检索模式RETR_EXTERNAL :只检索最外面的轮廓;RETR_LIST:原创 2020-09-27 17:00:24 · 1317 阅读 · 0 评论 -
【CV视觉基础】canny边缘检测(python实现)
Canny边缘检测使用高斯滤波器,以平滑图像,滤除噪声。计算图像中每个像素点的梯度强度(大小)和方向。应用非极大值(Non-Maximum Suppression)抑制,以消除边缘检测带来的杂散响应。抑制掉小的梯度值~NMS应用双阈值(Double-Threshold)检测来确定真实的和潜在的边缘。保留最真实的!通过抑制孤立的弱边缘最终完成边缘检测。1:高斯滤波器2.梯度和方向3:非极大值抑制 两种方法~比较当前点与挨着的两个点的情况,大于就抑制掉它还有另一种方法:4:双阈值原创 2020-09-27 15:58:08 · 669 阅读 · 0 评论 -
【CV视觉基础】opencv实战-基本操作(二) 梯度处理(python实现)
形态学-腐蚀操作侵犯一些东西,改变原样。去除毛刺,线条变细逐步迭代腐蚀的话边界越来越弱erodeimg = cv2.imread('dige.png')cv2.imshow('img', img)cv2.waitKey(0)cv2.destroyAllWindows()kernel = np.ones((3,3),np.uint8) erosion = cv2.erode(img,kernel,iterations = 1)cv2.imshow('erosion', erosio原创 2020-09-27 15:41:56 · 228 阅读 · 0 评论 -
【CV视觉基础】opencv实战-基本操作(python实现)
数据读取-图像cv2.IMREAD_COLOR:彩色图像cv2.IMREAD_GRAYSCALE:灰度图像cv.waitkey(): 等待时间,0表示任意键停止img.shape输出h,w,cc=3表示BGR彩色图img.read 读取图像保存:cv2.imwrite()图像的显示#图像的显示,也可以创建多个窗口cv2.imshow('image',img) # 等待时间,毫秒级,0表示任意键终止cv2.waitKey(10000) cv2.destroyAllWindows().原创 2020-09-25 17:42:36 · 635 阅读 · 0 评论 -
【CV视觉基础】图像插值算法&OpenCV框架
简介在图像处理中,平移变换、旋转变换以及放缩变换是一些基础且常用的操作。这些几何变换并不改变图象的象素值,只是在图象平面上进行象素的重新排列。在一幅输入图象[u,v][u,v][u,v]中,灰度值仅在整数位置上有定义。然而,输出图象[x,y]的灰度值一般由处在非整数坐标上的(u,v)(u,v)(u,v)值来决定。这就需要插值算法来进行处理,常见的插值算法有最近邻插值、双线性插值和三次样条插值。算法理论介绍与推荐最近邻插值算法原理实现代码 numpy和cv2import numpy as np原创 2020-09-24 15:55:04 · 346 阅读 · 0 评论 -
【CV必读】数据增强方法总结
概念理解数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。必要性解决数据不足的问题,为了获得更多的数据,我们只要对现有的数据集进行微小的改变。比如旋转(flips)、移位(translations)、旋转(rotations)等微小的改变。我们的网络会认为这是不同的图片。数据增强可以分为,有监督的数据增强和无监督的数据增强方法。其中有监督的数据增强又可以分为单样本数据增强和多样本数据增强方法,无监督的数据增强分为生成新的数据和学习增强策略两个方向。方法总原创 2020-09-18 17:10:28 · 2223 阅读 · 0 评论 -
计算机视觉(算法与应用):Convolutional Neural Networks
历史:应用场景:image captioning, calssification,retrieval, detection, 分割、图像风格迁移介绍:池化:降维作用逐层介绍:FC层对卷积的结果要使用激活函数卷积层:做点积运算最终得到一个激活图stride是滤波器的移动步长!实际中会边界扩充,扩0行!zero padding例题:总结:K为2的奇数层注意1x1的滤波器卷积层的样子:激活层的宽高深与卷积层是完全相同的池化层:作用原创 2020-06-09 09:33:43 · 220 阅读 · 0 评论 -
计算机视觉(算法与应用):NN and Backpropagation
特征变换:图像直接到分类即为端到端的形式!没有激活函数就变成了线性!常用的激活函数主要有:神经元的结构!!!原创 2020-06-08 10:44:35 · 197 阅读 · 0 评论 -
计算机视觉(算法与应用):卷积神经网络(图像分类,损失函数,优化设计)
基于卷积神经网络的视觉应用多种多样:三维重建、目标检测、步态检测、图像检索与理解等神经网络的三要素:图像分类原创 2020-05-19 10:19:52 · 1576 阅读 · 0 评论