
计算机视觉
文章平均质量分 75
计算机视觉小白,记录学习历程
Star星屹程序设计
编程新手,个人记笔记,方便日后看,很多东西记着只是为了自己方便。。喷子请绕道!!!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[YOLOX]——训练自己的数据集(Ubuntu20.04)
YOLOX踩炕记录原创 2021-11-12 16:38:40 · 5712 阅读 · 0 评论 -
YOLO系列——[WinError 1455] 页面文件太小,无法完成操作
最近在用yolo系列训练自己的数据,但是在调参数时,batch_size稍微网上调整点就会出错(比如:4,8等),报错信息如下:提示页面文件太小[WinError 1455] 页面文件太小,无法完成操作。 Error loading "D:\ProgramData\Anaconda3\envs\yolov5_gpu\lib\site-pack一、首先考虑虚拟内存的大小修改windows的虚拟内存:这里可以看到,自动管理状态下的虚拟内存很小,根本不满足需求这里,我们根据...原创 2021-10-21 15:31:35 · 13443 阅读 · 5 评论 -
[目标检测]——YOLOv3
代码下载:链接:https://pan.baidu.com/s/17pQtRoiqDiavmPrMX_gFfQ 提取码:50r2论文下载:链接:https://pan.baidu.com/s/1ovgn988hVPVTAEN7dXHHnA提取码:c1bg代码配置相关注:基础配置可参考本人博客:(2条消息) [目标检测]——YOLOv5模型使用记录_Star星屹程序设计的博客-优快云博客https://blog.youkuaiyun.com/weixin_42067873/article/detai...原创 2021-10-06 18:53:24 · 1008 阅读 · 0 评论 -
[图片校准(矫正)]——透射变换应用
如果想要对图像进行校准,那么透射变换是非常有效的变换方法。透射变换的定义如下:将图像投影到一个新的视平面,通常也成为投影映射。 详情参考链接:透射变换介绍1、举例说明直观的来看,透视变换的作用就是将左侧图像的坐标点 [[50,0],[150,0],[0,200],[200,200]]转化为新的坐标 [[0,0],[200,0],[0,200],[200,200]]2、应用原图是一个旋转过的图片,现在需要做图片矫正,将图片放正。做法:手工选去需要矫正区域四个角上...原创 2021-09-03 21:57:45 · 2130 阅读 · 0 评论 -
[图像处理]——图像阈值
如下图所示即为OpenCV中关于阈值的函数,其中:设置的阈值是针对每个像素点判断的,如果当前像素点的值大于阈值,赋什么值,maxval最大取值为255(0<黑>~255<白>)简单使用:import matplotlib.pyplot as pltimport cv2 as cvimg = cv.imread("images/girl.jpg", cv.IMREAD_COLOR)image_gray = cv.cvtColor(img, cv.COLOR...原创 2021-08-21 09:07:16 · 760 阅读 · 0 评论 -
[目标检测]——YOLO论文学习(v1)
论文提取链接:链接:https://pan.baidu.com/s/1LqNBgL9Va4puiDEljp9syg 提取码:visfYOLO设计之初:就希望网络比较迅速,做到实时处理(你仅看一眼)—— One Stage网络原创 2021-08-06 18:08:16 · 260 阅读 · 0 评论 -
[角点特征]——Harris和Shi-Tomas算法
一、角点特征1、图像特征二、Harris角点检测1、原理Harris角点检测的思想是通过图像的局部的小窗口观察图像,角点的特征是窗口沿着任意方向移动都会导致图像灰度的明显变化,如下图所示:其中 I(x,y)是局部窗口的图像灰度,I(x+u, y+v) 是平移后的图像灰度, w(x, y) 是窗口函数,可以是矩形窗口,也可以是对每一个像素赋予不同权重的高斯窗口,如下所示:推导如下:2、Harris计算方法角点判断:当R为大数值的正数时是角点 ...原创 2021-07-16 09:07:27 · 621 阅读 · 3 评论 -
[模板匹配&霍夫变换]——模板匹配分析、霍夫变换分析
一、模板匹配分析所谓模板匹配,就是在给定的图片中查找和模板最相似的区域,该算法的输入包括模板和图片,整个任务的思路就是按照滑窗的思路不断的移动模板图片,计算其与图像中对应区域的匹配度,最终将匹配度最高的区域选择为最终的结果。1、实现流程(1)准备两副图像原图像(I):在这幅图中,找到与模板相匹配的区域 模板(T):与原图像进行比对的图像块(2)滑动模板图像和原图像进行比对(3)对于每一个位置将计算的相似结果保存在结果矩阵(R)中(4)获得上述图像后,查找最大值..原创 2021-07-14 17:21:23 · 1150 阅读 · 1 评论 -
[边缘检测]——Sobel算子、Scharr算子、Laplacian算子、Canny边缘检测
边缘检测是图像处理和计算机视觉中基本的问题,边缘检测的目的是标识数字图像中亮度变化明显的点,图像属性中的显著变化通常反映了属性的重要事件和变化。边缘的表现形式如下图所示:一、边缘检测的分类图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性,有许多方法用于边缘检测,它们的绝大部分可以划分为两类:(1)基于搜索(2)基于零穿越的注:两类边缘检测方法都是基于导数的。1、基于搜索的2、基于零穿越的基于零穿越的,是在基于搜索的基础上进..原创 2021-07-10 15:00:39 · 2665 阅读 · 1 评论 -
[图像处理]——直方图相关
一、灰度直方图1、原理直方图是对数据进行统计的一种方法,并且将统计值组织到一系列事先定义好的bin当中。其中,bin 为直方图中经常用到的一个概念,可以译为 “直条” 或 “组距”,其数值是从数据中计算出的特征统计量,这些数据可以是诸如梯度、方向、色彩或者其他任何特征。注意:直方图是根据灰度图进行绘制的。假设有一张图像的信息(灰度值0~255,已知数字的范围包含256个值),于是可以按照一定的规律将这个范围分割成子区域(也就是bins),如:2、术语和细节dims:需.原创 2021-07-09 09:29:16 · 903 阅读 · 1 评论 -
[图像平滑]——图像噪声、均值滤波、高斯滤波、中值滤波
一、图像噪声由于图像采集、处理、传输等过程不可避免的会受到噪声的污染,妨碍人们对图像理解及分析处理。常见的图像噪声有高斯噪声、校验噪声等。1、椒盐噪声2、高斯噪声高斯噪声是指噪声的密度服从高斯分布的一类噪声,由于高斯噪声在空间和频域中数学上的易处理性,这种噪声(也称为正态噪声)模型经常被用于实践中。高斯噪声随机变量Z的概率密度函数由下式给出:加入高斯噪声后的效果:二、图像平滑图像平滑从信号处理的角度看就是去除其中的高频信息,保留低频信息。因此我们可以对图像.原创 2021-07-07 17:01:54 · 3913 阅读 · 1 评论 -
[图像形态学操作]——腐蚀和膨胀、开闭运算、黑帽礼帽
形态学转换是基于图像形状的一些简单操作,它通常在二进制图像上执行。腐蚀和膨胀是两个基本的形态学运算符。然后它的变体形式如:开运算、闭运算、礼帽黑帽等。一、连通性在图像学当中,图像的最小单位是像素,每个像素周围有8个邻接像素,常见的邻接关系有3种:4领接、D邻接和8邻接连通性是描述区域和边界的重要概念,两个像素连通的两个必要条件是:1、两个像素的位置是否相邻2、两个像素的灰度值是否满足特定的相似性准则(或者是否相等)根据连通性的定义,有4连通、8连通和m连通三种1..原创 2021-07-07 13:47:49 · 2225 阅读 · 2 评论 -
[图像几何变换]——图像的仿射变换、透射变换及图像金字塔
一、仿射变换1、介绍图像的仿射变换涉及到图像的形状位置角度的变化,是深度学习预处理中常用的功能,fang'she原创 2021-07-06 09:52:54 · 1101 阅读 · 0 评论 -
[目标检测]——YOLOv5模型使用记录
1、创建文件、xml等存放位置在yolov5目录下创建data文件夹(名字可以自定义),目录结构如下,将之前labelImg标注好的xml文件和图片放到对应目录下:…images # 存放图片…Annotations # 存放图片对应的xml文件…ImageSets/Main #之后会在Main文件夹内自动生成train.txt,val.txt,test.txt和trainval.txt四个文件,存放训练集、验证集、测试集图片的名字(无后缀.jpg)2、数据集分割ImageS.原创 2021-07-01 14:08:32 · 2347 阅读 · 0 评论 -
[目标检测]——YOLO(You only look once)
从下图可以看出:YOLO的速度最快一、YOLO介绍1、网络分析原创 2021-06-25 20:44:16 · 983 阅读 · 1 评论 -
[目标检测]——Fast R-CNN算法、Faster R-CNN算法
SPPNet的性能已经得到很大的改善,但是由于网络之间不统一训练,造成很大的麻烦,所以接下来的Fast R-CNN就是为了解决这样的问题。一、Fast R-CNN介绍1、Fast R-CNN改进之处提出了一个Roipooling,然后整合整个模型,把CNN、Rolpooling、分类器、bbox回归几个模型整合到一起训练。2、步骤分类是使用softmax计算,不再使用SVM。二、Roipooling首先需要注意的是:Rol pooling只是一个简单版本的S..原创 2021-06-24 23:02:48 · 282 阅读 · 5 评论 -
[目标检测]——SPPNet算法
SPPNet对R-CNN进行了改进,首先分析R-CNN慢在哪里?原创 2021-06-21 12:24:55 · 292 阅读 · 2 评论 -
[目标检测]——R-CNN算法
不使用暴力方法,而是用候选区域方法(region proposal method),创建目标检测的区域改变了图像领域实现物体检测的模型思路,R-CNN是以原创 2021-06-07 14:56:07 · 655 阅读 · 0 评论 -
[目标检测]——Overfeat模型
Overfeat模型设计主要为了解决多个物体的检测问题一、滑动窗口目标见发原创 2021-06-03 08:56:15 · 619 阅读 · 0 评论 -
[图像几何变换]——算数操作及几何变换
一、图像的加法在这里,可以使用OpenCV的cv.add()函数把两幅图像相加,或者可以简单的通过numpy操作添加两个图像原创 2021-05-31 12:16:09 · 214 阅读 · 2 评论 -
LabelImg(Windows)——图片打标签
为数据集打标签的方法和工具有很多,诸如:Labelme、LabelImg等,此处介绍LabelImg。一、LabelImg工具下载下载地址:链接:https://pan.baidu.com/s/1--iHW788mgTNEyX6yazfog 提取码:f828注:下载的文件是编译好的,可执行的LabelImg.exe文件。直接将文件放到Windows环境下,双击便可执行。二、LabelImg工具的使用方法1、双击出现操作界面在labelImg窗口的左边,有一些操作...原创 2021-05-27 07:49:11 · 2610 阅读 · 2 评论 -
[目标检测]——基础介绍
一、目标检测算法分类1、两步走的目标检测先进行区域推荐,而后进行目标检测d原创 2021-05-30 06:08:00 · 791 阅读 · 1 评论 -
[图像处理]——基本操作(OpenCV)
一、图片的IO操作1、读取图片读取图片使用 cv.imread(图片路径,读取方式)参数:使用函数 cv2.imread() 读入图像。这幅图像应该在此程序的工作路径,或者给函数提供一个完整的路径,第二个参数是要告诉函数应该如何读取这幅图片。cv2.IMREAD_COLOR:加载彩色图像,图像的任何透明度都会被忽略,是该方法的默认方式。 cv2.IMREAD_GRAYSCALE :以灰度模式加载图像。 cv2.IMREAD_UNCHANGED : 以包含Alpha通道的方式加.原创 2021-05-28 16:08:35 · 709 阅读 · 1 评论 -
[图像处理]——OpenCV简介
一、图像处理简介1、图像是什么图像是人类视觉的基础,是自然景物的客观反映,是人类认识世界和人类本身的重要源泉。“图”是物体反射或透射光的分布,“像“是人的视觉系统所接受的图在人脑中所形成的印象或认识,照片、绘画、剪贴画、地图、书法作品、手写汉学、传真、卫星云图、影视画面、X光片、脑电图、心电图等都是图像。2、模拟图像和数字图像模拟图像:连续存储的数据模拟图像:在图像处理中,像纸质照片、电视模拟图像等,这种通过某种物理量(如光、电等)的强弱变化来记录图像亮度信息的图像。 特点:物理原创 2021-05-10 11:01:19 · 1102 阅读 · 1 评论