自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 NMS(非极大值抑制)

例如在⾏⼈检测中,滑动窗⼝经提取特征,经分类器分类识别后,每个窗⼝都会得到⼀个分数。这时就需要⽤到NMS来选取那些邻域⾥分数最⾼(是⾏⼈的概率最⼤),并且抑制那些分数低的窗⼝。在⽬标检测中,NMS的⽬的就是要去除冗余的检测框,保留最好的⼀个。NMS的原理是对于预测框的列表B及其对应的置信度S,选择具有最⼤score的检测框M,将其从B集合中移除并加⼊到最终的检测结果D中.通常将B中剩余检测框中与M的IoU ⼤于阈值Nt的框从B中移除.重复这个过程,直到B为空。

2025-02-25 14:28:52 120

原创 IOU交并比计算

IoU = 两个矩形框相交的⾯积 / 两个矩形框相并的⾯积。

2025-02-23 16:03:14 128

原创 opencv视频读写

在显示图像时使⽤cv.waitkey()设置适当的持续时间,如果太低视频会播放的⾮常快,如果太⾼就会播放的非常慢,通常情况下设置25ms就可以了。利⽤cap.read()获取视频中的每⼀帧图像,并使⽤out.write()将某⼀帧图像写⼊。在OpenCV中我们要获取⼀个视频,需要创建⼀个VideoCapture对象,指定你要读。使⽤cap.release()和out.release()释放资源。

2025-02-21 22:29:18 634

原创 opencv边缘检测

边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的⽬的是标识数字图像中亮度变化明显的点。有许多⽅法⽤于边缘检测,⼤部分可以划分为两类:基于搜索和基于零穿越。基于搜索:通过寻找图像⼀阶导数中的最⼤值来检测边界,然后利⽤计算结果估计边缘的局部⽅向,通常采⽤梯度的⽅向,并利⽤此⽅向找到局部梯度模的最⼤值,代表算法是Sobel算⼦Scharr算⼦。基于零穿越:通过寻找图像⼆阶导数零穿越来寻找边界,代表算法是Laplacian算⼦。

2025-02-21 20:57:51 921

原创 opencv图像直方图

所以在每⼀个的区域中, 直⽅图会集中在某⼀个小的区域中)。对于每个⼩块来说,如果直⽅图中的 bin 超过对⽐度的上限的话,就把其中的像素点均匀分散到其他 bins 中,然后在进⾏直⽅图均衡化。这种⽅法提⾼图像整体的对⽐度,特别是有⽤数据的像素值分布⽐较接近时,在曝光过度或不⾜的图像中可以更好的突出细节。掩膜是⽤选定的图像、图形或物体,对要处理的图像进⾏遮挡,来控制图像 处理的区域。掩膜是由0和1组成⼀个⼆进制图像,利⽤该掩膜图像要处理的图像进⾏掩膜,其中1值的区域被处理,0值区域被屏蔽,不会处理。

2025-02-21 18:24:06 850

原创 opencv 图像平滑

中值滤波是⼀种典型的⾮线性滤波技术,基本思想是⽤像素点邻域灰度值的中值来代替该像素点的灰度值。参数:src:输⼊图像 ksize:卷积核的⼤⼩ anchor:默认值 (-1,-1) ,表示核中⼼。ksize:⾼斯卷积核的⼤⼩,注意 : 卷积核的宽度和⾼度都应为奇数,且可以不同。椒盐噪声也称为脉冲噪声,是图像中经常⻅到的⼀种噪声,它是⼀种随机出现的⽩。转换器或位元传输错误等。常⻅的图像噪声有⾼斯噪声、椒盐噪声等。⾼斯噪声是指噪声密度函数服从⾼斯分布的⼀类噪声。导致像素值为最⼤值。

2025-02-21 01:44:10 407

原创 opencv 形态学操作

形态学转换是基于图像形状的⼀些简单操作。它通常在⼆进制图像上执⾏。腐蚀和膨胀是两个基本的形态学运算符。然后它的变体形式如开运算,闭运算,礼帽⿊帽等。它需要两个输入,一个是我们的原始图像,第二个是决定操作性质的结构元素或内核。

2025-02-20 22:26:12 303

原创 opencv图像几何变换

在这四个点中,其中三个不应共线。为了找到变换矩阵,我们需要输入图像中的三个点及其在输出图像中的对应位置。参数: src : 输⼊图像 dsize: 绝对尺⼨,直接指定调整后图像的⼤⼩ fx,fy: 相对尺⼨,将 dsize 设置为 None ,然后将 fx 和 fy 设置为⽐例因⼦即可。具有不同分辨率的图像集称为“图像金字塔”(因为当它们堆叠在底部时,最高分辨率的图像位于顶部,最低分辨率的图像位于顶部时,看起来像金字塔)。图像的仿射变换涉及到图像的形状位置⻆度的变化,是深度学习预处理中常到的功。

2025-02-20 20:33:47 1581

原创 opencv算数操作

你可以使⽤ OpenCV 的 cv.add() 函数把两幅图像相加,或者可以简单地通过 numpy 操作添加两个图像,如 res = img1 + img2。两个图像应该具有相同的⼤⼩和类型, 或者第⼆个图像可以是标量值。函 数 cv2.addWeighted() 可以按下⾯的公式对图⽚进⾏混合操作。注意: OpenCV 加法和 Numpy 加法之间存在差异。OpenCV 的加法是饱和操作,⽽ Numpy 添加是模运算。其实也是加法,但是不同的是两幅图像的权重不同,这就会给⼈⼀种混合或者透明的感觉。

2025-02-15 16:06:21 241

原创 opencv图像色彩通道操作

【代码】opencv图像色彩通道操作。

2025-02-14 21:03:39 212

原创 OpenCV在图像上绘制几何图形

Leftupper, rightdown: 矩形的左上⻆和右下⻆坐标。Thickness: 线条宽度,为-1 时⽣成闭合图案并填充颜⾊。Start,end: 直线的起点和终点。station :⽂本的放置位置。Thickness: 线条宽度。Thickness: 线条宽度。Fontsize : 字体⼤⼩。text :要写⼊的⽂本数据。img: 要绘制直线的图像。img: 要绘制圆形的图像。img: 要绘制矩形的图像。color: 线条的颜⾊。color: 线条的颜⾊。color: 线条的颜⾊。

2025-02-14 19:53:19 185

原创 OpenCV 安装部署

objdetect 模块实现了⼀些⽬标检测的功能,经典的基于 Haar 、 LBP 特征的⼈ 脸检测,基于 HOG 的⾏⼈、汽⻋等⽬标检测,分类器使⽤ Cascade Classification (级联分类)和 Latent SVM 等。包含了基本的多视⻆⼏何算法,单个⽴体摄像头标定,物体姿态 估计,⽴体相似性算法, 3D 信息的重建等等。imgproc 模块实现了图像处理的基础⽅法,包括图像滤波、图像的⼏何变换、 平滑、阈值分割、形态学处理、边缘检测、⽬标检测、运动分析和对象跟踪等。

2025-02-14 19:20:26 375

原创 神经网络基础激活函数

输入值小于0为0,大于0等于本身,更重视正信号忽略负信号,函数运算简单,能够提高模型的训练效率,网络参数随机初始化时,参数为正值舍去,参数为负值保留。值域(0,1) 输入的值大致大于6时趋向1,小于-6时趋向0,输入值大致在[-6,6]时,输出值才会有明显差异,[-3,3]时,才会有比较好的效果。Tanh 激活函数的导数:值域(0,1),输入的值大致大于3和小于-3时趋向0,此时网络参数更新缓慢或者无法更新(梯度消失)。3、神经网络在进行参数更新反向传播算法(BP),所以激活函数必须可微。

2025-02-11 16:39:33 133

原创 OpenCV中的深度学习模块(DNN)

OpenCV 中的深度学习模块( DNN )只提供了推理功能,不涉及模型的训练,⽀持 多种深度学习框架,⽐如 TensorFlow , Caffe,Torch 和 Darknet。常⽤⽅法简介。

2025-02-10 18:58:07 1737

原创 图像处理和计算机视觉任务的Python工具库imutils 安装使用

imutils imutils是在OPenCV基础上的一个简单封装从而达到更为简结的调用OPenCV接口的目的,来轻松的实现图像的平移,旋转,缩放,骨架化等一系列的操作。

2025-02-09 19:35:37 81

原创 数据结构线性表

数据结构线性表

2022-06-24 10:31:19 100 1

原创 数据结构判断链表是否为空:

数据结构判断链表是否为空

2022-06-15 22:50:01 2105 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除