FE80-优快云博客

原创 NMS（非极大值抑制）

例如在⾏⼈检测中，滑动窗⼝经提取特征，经分类器分类识别后，每个窗⼝都会得到⼀个分数。这时就需要⽤到NMS来选取那些邻域⾥分数最⾼（是⾏⼈的概率最⼤），并且抑制那些分数低的窗⼝。在⽬标检测中，NMS的⽬的就是要去除冗余的检测框,保留最好的⼀个。NMS的原理是对于预测框的列表B及其对应的置信度S,选择具有最⼤score的检测框M,将其从B集合中移除并加⼊到最终的检测结果D中.通常将B中剩余检测框中与M的IoU ⼤于阈值Nt的框从B中移除.重复这个过程,直到B为空。

2025-02-25 14:28:52 120

原创 IOU交并比计算

IoU = 两个矩形框相交的⾯积 / 两个矩形框相并的⾯积。

2025-02-23 16:03:14 128

原创 opencv视频读写

在显示图像时使⽤cv.waitkey()设置适当的持续时间，如果太低视频会播放的⾮常快，如果太⾼就会播放的非常慢，通常情况下设置25ms就可以了。利⽤cap.read()获取视频中的每⼀帧图像，并使⽤out.write()将某⼀帧图像写⼊。在OpenCV中我们要获取⼀个视频，需要创建⼀个VideoCapture对象，指定你要读。使⽤cap.release()和out.release()释放资源。

2025-02-21 22:29:18 634

原创 opencv边缘检测

边缘检测是图像处理和计算机视觉中的基本问题，边缘检测的⽬的是标识数字图像中亮度变化明显的点。有许多⽅法⽤于边缘检测,⼤部分可以划分为两类：基于搜索和基于零穿越。基于搜索：通过寻找图像⼀阶导数中的最⼤值来检测边界，然后利⽤计算结果估计边缘的局部⽅向，通常采⽤梯度的⽅向，并利⽤此⽅向找到局部梯度模的最⼤值，代表算法是Sobel算⼦Scharr算⼦。基于零穿越：通过寻找图像⼆阶导数零穿越来寻找边界，代表算法是Laplacian算⼦。

2025-02-21 20:57:51 921

原创 opencv图像直方图

所以在每⼀个的区域中，直⽅图会集中在某⼀个小的区域中）。对于每个⼩块来说，如果直⽅图中的 bin 超过对⽐度的上限的话，就把其中的像素点均匀分散到其他 bins 中，然后在进⾏直⽅图均衡化。这种⽅法提⾼图像整体的对⽐度，特别是有⽤数据的像素值分布⽐较接近时，在曝光过度或不⾜的图像中可以更好的突出细节。掩膜是⽤选定的图像、图形或物体，对要处理的图像进⾏遮挡，来控制图像处理的区域。掩膜是由0和1组成⼀个⼆进制图像，利⽤该掩膜图像要处理的图像进⾏掩膜，其中1值的区域被处理，0值区域被屏蔽，不会处理。

2025-02-21 18:24:06 850

原创 opencv 图像平滑

中值滤波是⼀种典型的⾮线性滤波技术，基本思想是⽤像素点邻域灰度值的中值来代替该像素点的灰度值。参数:src：输⼊图像 ksize：卷积核的⼤⼩ anchor：默认值 (-1,-1) ，表示核中⼼。ksize:⾼斯卷积核的⼤⼩，注意：卷积核的宽度和⾼度都应为奇数，且可以不同。椒盐噪声也称为脉冲噪声，是图像中经常⻅到的⼀种噪声，它是⼀种随机出现的⽩。转换器或位元传输错误等。常⻅的图像噪声有⾼斯噪声、椒盐噪声等。⾼斯噪声是指噪声密度函数服从⾼斯分布的⼀类噪声。导致像素值为最⼤值。

2025-02-21 01:44:10 407

原创 opencv 形态学操作

形态学转换是基于图像形状的⼀些简单操作。它通常在⼆进制图像上执⾏。腐蚀和膨胀是两个基本的形态学运算符。然后它的变体形式如开运算，闭运算，礼帽⿊帽等。它需要两个输入，一个是我们的原始图像，第二个是决定操作性质的结构元素或内核。

2025-02-20 22:26:12 303

原创 opencv图像几何变换

在这四个点中，其中三个不应共线。为了找到变换矩阵，我们需要输入图像中的三个点及其在输出图像中的对应位置。参数： src : 输⼊图像 dsize: 绝对尺⼨，直接指定调整后图像的⼤⼩ fx,fy: 相对尺⼨，将 dsize 设置为 None ，然后将 fx 和 fy 设置为⽐例因⼦即可。具有不同分辨率的图像集称为“图像金字塔”（因为当它们堆叠在底部时，最高分辨率的图像位于顶部，最低分辨率的图像位于顶部时，看起来像金字塔）。图像的仿射变换涉及到图像的形状位置⻆度的变化，是深度学习预处理中常到的功。

2025-02-20 20:33:47 1581

原创 opencv算数操作

你可以使⽤ OpenCV 的 cv.add() 函数把两幅图像相加，或者可以简单地通过 numpy 操作添加两个图像，如 res = img1 + img2。两个图像应该具有相同的⼤⼩和类型，或者第⼆个图像可以是标量值。函数 cv2.addWeighted() 可以按下⾯的公式对图⽚进⾏混合操作。注意： OpenCV 加法和 Numpy 加法之间存在差异。OpenCV 的加法是饱和操作，⽽ Numpy 添加是模运算。其实也是加法，但是不同的是两幅图像的权重不同，这就会给⼈⼀种混合或者透明的感觉。

2025-02-15 16:06:21 241

原创 opencv图像色彩通道操作

【代码】opencv图像色彩通道操作。

2025-02-14 21:03:39 212

原创 OpenCV在图像上绘制几何图形

Leftupper, rightdown: 矩形的左上⻆和右下⻆坐标。Thickness: 线条宽度，为-1 时⽣成闭合图案并填充颜⾊。Start,end: 直线的起点和终点。station ：⽂本的放置位置。Thickness: 线条宽度。Thickness: 线条宽度。Fontsize : 字体⼤⼩。text ：要写⼊的⽂本数据。img: 要绘制直线的图像。img: 要绘制圆形的图像。img: 要绘制矩形的图像。color: 线条的颜⾊。color: 线条的颜⾊。color: 线条的颜⾊。

2025-02-14 19:53:19 185

原创 OpenCV 安装部署

objdetect 模块实现了⼀些⽬标检测的功能，经典的基于 Haar 、 LBP 特征的⼈脸检测，基于 HOG 的⾏⼈、汽⻋等⽬标检测，分类器使⽤ Cascade Classification （级联分类）和 Latent SVM 等。包含了基本的多视⻆⼏何算法，单个⽴体摄像头标定，物体姿态估计，⽴体相似性算法， 3D 信息的重建等等。imgproc 模块实现了图像处理的基础⽅法，包括图像滤波、图像的⼏何变换、平滑、阈值分割、形态学处理、边缘检测、⽬标检测、运动分析和对象跟踪等。

2025-02-14 19:20:26 375

原创神经网络基础激活函数

输入值小于0为0，大于0等于本身，更重视正信号忽略负信号，函数运算简单，能够提高模型的训练效率，网络参数随机初始化时，参数为正值舍去，参数为负值保留。值域(0,1) 输入的值大致大于6时趋向1，小于-6时趋向0，输入值大致在[-6,6]时，输出值才会有明显差异，[-3,3]时，才会有比较好的效果。Tanh 激活函数的导数：值域(0,1)，输入的值大致大于3和小于-3时趋向0，此时网络参数更新缓慢或者无法更新（梯度消失）。3、神经网络在进行参数更新反向传播算法(BP)，所以激活函数必须可微。

2025-02-11 16:39:33 133

原创 OpenCV中的深度学习模块（DNN）

OpenCV 中的深度学习模块（ DNN ）只提供了推理功能，不涉及模型的训练，⽀持多种深度学习框架，⽐如 TensorFlow ， Caffe,Torch 和 Darknet。常⽤⽅法简介。

2025-02-10 18:58:07 1737

原创图像处理和计算机视觉任务的Python工具库imutils 安装使用

imutils imutils是在OPenCV基础上的一个简单封装从而达到更为简结的调用OPenCV接口的目的，来轻松的实现图像的平移，旋转，缩放，骨架化等一系列的操作。

2025-02-09 19:35:37 81

原创数据结构线性表

数据结构线性表

2022-06-24 10:31:19 100 1

原创数据结构判断链表是否为空：

数据结构判断链表是否为空

2022-06-15 22:50:01 2105 1

m0_58687013的博客