深度学习03-(图像梯度处理、图像轮廓、图像预处理在AI中的应用)

最新推荐文章于 2025-04-18 21:58:56 发布

原创

最新推荐文章于 2025-04-18 21:58:56 发布 · 1.4k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #计算机视觉 #图像梯度 #图像轮廓

本文深入探讨了深度学习在计算机视觉中的应用，包括图像梯度处理、边沿检测、锐化、图像轮廓检测等关键技术。通过实例展示了图像预处理、数据增强及纯图像技术的局限性。

深度学习03-计算机视觉基本理论2

深度学习03-(计算机视觉基本理论2)

深度学习03-(计算机视觉基本理论2)

图像梯度处理

在这里插入图片描述

什么是图像梯度

在这里插入图片描述

模板运算

在这里插入图片描述

均值滤波

在这里插入图片描述

高斯滤波

在这里插入图片描述

中值滤波

在这里插入图片描述

边沿检测

在这里插入图片描述

锐化

在这里插入图片描述

图像轮廓

在这里插入图片描述

什么是图像轮廓

在这里插入图片描述

查找和绘制轮廓

在这里插入图片描述

轮廓拟合

在这里插入图片描述

矩形包围框

在这里插入图片描述

最小包围圆形

在这里插入图片描述

最优拟合椭圆

在这里插入图片描述

逼近多边形

在这里插入图片描述

综合案例

在这里插入图片描述

# 图像校正示例
import cv2
import numpy as np

im = cv2.imread("../data/paper.jpg")
gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
cv2.imshow

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

YEGE学AI算法

关注关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

人工智能——图像梯度处理、边缘检测、绘制图像轮廓、凸包特征检测

a150463的博客

07-27

2182

例如，假设当前像素点为（x，y），其梯度方向是 0°，梯度值为 G（x，y），那就需要比较 G（x，y）与两个相邻像素的梯度值：G（x - 1，y）和 G（x + 1，y）。如果 G（x，y）是三个值里面最大的，就保留该像素值，否则将其抑制为零。经过前面计算得到的边缘像素点往往比较多，这是因为高斯滤波的影响使得边缘变得模糊了，所以需要对其进行过滤操作，非极大值抑制就是一种有效的方法，在这一步骤中，需要检查每个像素点的梯度方向上的相邻像素，并保留梯度值最大的像素，将其他像素抑制为零。

图像处理理论和应用---图像预处理技术

weixin_46414576的博客

04-27

5292

图像预处理技术图像处理的形式 • 按图像处理的输入和输出形式，图像处理的基本功能可分为以下几种形式： • 单幅图像输入，进行处理，输出单幅图像。 • 多幅图像输入，进行处理，输出单幅图像。 • 单幅图像输入，进行处理，输出数字或符号等内容。 • 多幅图像输入，进行处理，输出数字或符号等内容。 • 对于人工智能方向的图像处理任务，最终的处理结果通常是代表具体内容的数字或者符号。所以上述前两种仍然输...

参与评论您还未登录，请先登录后发表或查看评论

深度学习程序的预处理

04-08

2937

深度学习程序的预处理，理论与实践相结合，让我们共同探索预处理的细节!

(转)在图像处理中，散度 div 具体的作用是什么？

weixin_33963594的博客

09-16

792

出处http://www.zhihu.com/question/24591127 按：今天看到这篇文章，有点感慨，散度这个概念我初次接触到至少应该是在1998年，时隔这么多年后看到这篇文章，真的佩服作者的功底，不管怎么样，能那么形象的说出散度的意义，已经就知道作者不是一般的“人云亦云”型抄客，而是有真才实学的真知，转在这里权当是对自己的鞭策和学习。 -----------...

计算机视觉及图像预处理（一） 01-图像梯度处理

llf000000的博客

11-03

855

板子

深度学习预处理

feifeiziPro的博客

10-16

328

Dropout，正向传播时随机将每一层的几个神经元置为0，避免过拟合，也可以把权重矩阵随机置0。网络之间插入：batch normalization，归一化之后可以适当的放缩。bath normalization，数据增强和上面都是一种正则化的手段。优化梯度下降，加入一个动量项，动量初值一般为0还有nesterov方法。训练过程中学习率动态衰减，带动量的SGD用的较多，Adam较少。梯度下降的问题：做之字运动，会掉入极小值点。前面两行的方法同时用，Adam。学习率：1e-3~1e-5。

图像梯度处理

m0_56600567的博客

11-23

2515

图像处理图像梯度-Sobel算子其他算子Scharr算子laplacian算子比较几个算子图像梯度-Sobel算子 img = cv2.imread(“pie.png”,cv2.IMREAD_GRAYSCALE) cv2.imshow(“img”,img) cv2.waitKey(0) cv2.destroyAllWindows() dst = cv2.Sobell(src,ddepth,dx,dy,ksize) ddepth : 图像的深度 dx,dy ：分别表示水平和竖直方向 ksize

图像预处理-图像噪点消除

最新发布

Clocky7

04-18

941

噪声：指图像中的一些干扰因素，也可以理解为有那么一些点的像素值与周围的像素值格格不入。常见的噪声类型包括高斯噪声和椒盐噪声。滤波器：也可以叫做卷积核- 低通滤波器是模糊，高通滤波器是锐化- 低通滤波器就是允许低频信号通过，在图像中边缘和噪点都相当于高频部分，所以低通滤波器用于去除噪点、平滑和模糊图像。高通滤波器则反之，用来增强图像边缘，进行锐化处理。注意：椒盐噪声可以理解为斑点，随机出现在图像中的黑点或白点；高斯噪声可以理解为拍摄图片时由于光照等原因造成的噪声。这是高斯噪声这是椒盐噪声，有很多黑白的或者孤立

Opencv之图像梯度处理和绘制图像轮廓

2403_88522504的博客

12-14

1505

Sobel 算子是一种常用的图像边缘检测方法，结合了一阶导数和高斯平滑，用于检测图像的梯度信息。

深度学习之图像分类（二）优化器

m0_46521375的博客

10-07

810

深度学习模型通过引入损失函数，用来计算目标预测的错误程度。根据损失函数计算得到的误差结果，需要对模型参数（即权重和偏差）进行很小的更改，以期减少预测错误。但问题是如何知道何时应更改参数，如果要更改参数，应更改多少？这就是引入优化器的时候了。简单来说，优化器可以优化损失函数，优化器的工作是以使损失函数最小化的方式更改可训练参数，损失函数指导优化器朝正确的方向移动。优化器即优化算法是用来求取模型的最优解的，通过比较神经网络自己预测的输出与真实标签的差距，也就是Loss函数。

基于深度学习的轮廓检测算法：综述.pdf

08-18

基于深度学习的轮廓检测算法：综述.pdf

第十三节图像处理之轮廓识别

12-04

import cv2 as cv import numpy as np def scan_edge_demo(img): gray = cv.cvtColor(img,cv.COLOR_BGR2GRAY) gray = cv.GaussianBlur(gray,(3,3),0) scan_edge = cv.Canny(gray,60,150) return scan_edge def scan_contours(img): scan_edge =scan_edge_demo(img) aa,contours,b= cv.findContours(scan_edge,cv.RETR_TREE,cv.CHAIN_APPROX_SIMPLE) cv.drawContours(img,contours,-1,(0,255,255),thickness=4) cv.imshow("scan_contours",img) src = cv.imread("E:/opencv/picture/taijie.png") cv.imshow("inital_window",src) scan_contours(src) cv.waitKey(0) cv.destroyAllWindows() 图片：分析： 1.Opencv发现轮廓的函数原型为：findContours(image, mode, method[, contours[, hierarchy[, offset]]]) -> image, contours, hierarchy image参数表示8位单通道图像矩阵，可以是灰度图，但更常用的是二值图像，一般是经过Canny、拉普拉斯等边缘检测算子处理过的二值图像。所以输入源需要二值化（threshold）处理或者边缘处理canny后才行 mode参数表示轮廓检索模式： ①CV_RETR_EXTERNAL：只检测最外围轮廓，包含在外围轮廓内的内围轮廓被忽略。 ②CV_RETR_LIST：检测所有的轮廓，包括内围、外围轮廓，但是检测到的轮廓不建立等级关系，彼此之间独立，没有等级关系，这就意味着这个检索模式下不存在父轮廓或内嵌轮廓。 ③CV_RETR_CCOMP：检测所有的轮廓，但所有轮廓只建立两个等级关系，外围为顶层，若外围内的内围轮廓还包含了其他的轮廓信息，则内围内的所有轮廓均归属于顶层。 ④CV_RETR_TREE：检测所有轮廓，所有轮廓建立一个等级树结构，外层轮廓包含内层轮廓，内层轮廓还可以继续包含内嵌轮廓。 method参数表示轮廓的近似方法： ①CV_CHAIN_APPROX_NONE 存储所有的轮廓点，相邻的两个点的像素位置差不超过1，即max （abs (x1 - x2), abs(y2 - y1) == 1。 ②CV_CHAIN_APPROX_SIMPLE压缩水平方向，垂直方向，对角线方向的元素，只保留该方向的终点坐标，例如一个矩形轮廓只需4个点来保存轮廓信息。 ③CV_CHAIN_APPROX_TC89_L1，CV_CHAIN_APPROX_TC89_KCOS使用teh-Chinl chain 近似算法。 contours参数是一个list，表示存储的每个轮廓的点集合。 hierarchy参数是一个list,list中元素个数和轮廓个数相同，每个轮廓contours[i]对应4个hierarchy元素hierarchy[i][0] ~hierarchy[i][3]，分别表示后一个轮廓、前一个轮廓、父轮廓、内嵌轮廓的索引编号，如果没有对应项，则该值为负数。 offset参数表示每个轮廓点移动的可选偏移量。 2.Opencv绘制轮廓的函数原型为：drawContours(image, contours, contourIdx, color[, thickness[, lineType[, hierarchy[, maxLevel[, offset]]]]]) -> image imgae参数表示目标图像。 contours参数表示所有输入轮廓。 contourIdx参数表示绘制轮廓list中的哪条轮廓，如果是负数，则绘制所有轮廓。 color参数表示轮廓的颜色。 thickness参数表示绘制的轮廓线条粗细，如果是负数，则绘制轮廓内部。 lineType参数表示线型。 hierarchy参数表示有关层次结构的可选信息。 maxLevel参数表示绘制轮廓的最大级别。如果为0，则仅绘制指定的轮廓。如果为1，则该函数绘制轮廓和所有嵌套轮廓。如果为2，则该函数绘制轮廓，所有嵌套轮廓，所有嵌套到嵌套的轮廓，等等。仅当有可用的层次结构时才考虑此参数。 offset参数表示可选的轮廓偏移参数，该参数可按指定的方式移动所有绘制的轮廓。关于轮廓检测，什么的样的情况会被判断为轮廓呢？答：因为在做轮廓检测之前需要进行二值化，所以对于图像的整个ROI区域只有黑白两个颜色，而下面两种情况会被检测作为轮廓： 1. 白色区域与黑色区域的边缘交接区域 2. 当背景为白色时，整个ROI区域的外边界就会被视为轮廓。（往往我们希望背景是黑色，所以如果出现这种情况时我们需要在二值化图像时对图像取反）。

13- 深度学习梯度下降算法优化 (基础知识) (深度学习)

March_A的博客

01-14

743

掌握参数初始化策略的优点掌握Mini-batch的特点以及优势掌握梯度下降算法优化的目的以及效果掌握指数移动平均值的好处掌握动量梯度下降法的优点以及RMSProp、Adam的特点掌握学习率衰减方式掌握标准化输入带来的网络学习速度的提升。

基于深度学习的图像边缘和轮廓提取

专业主义

05-13

9830

1、基于深度学习方法 1.1一般边缘检测 1.2目标轮廓检测 1.3语义边缘检测 1.4闭合边界检测 DOOBNet: Deep Object Occlusion Boundary Detection from an Image 2、传统方法

【深度学习入门】梯度实现

只识闲人不识君博客

05-16

676

梯度实现一、什么是梯度关于梯度就是全部向量的偏导数汇总而成的向量。梯度会指向函数的"最低处（最小值）"。虽然梯度会指向最低处，但并非任何时候都这样。实际上，梯度指示的方向是各点处函数值减少最多的方向。更严格的讲，梯度指示的方向是各点处的函数值减少最多的方向。二、代码 import numpy as np import matplotlib.pylab as plt def numerical_diff(f,x):#定义数值微分函数 h = 1e-4 # 0.0001 return

【OpenCV】- 多边形将轮廓包围

qq_44859533的博客

08-12

3613

说明：实际应用中，常常会将检测到的轮廓用多边形表示出来的需求。

HCIP-AI图像处理理论、应用

@@老胡的博客

06-27

1621

关于图像的处理理论和应用

【人工智能前沿弄潮】——生成式AI系列：Diffusers应用 (2) 训练扩散模型（无条件图像生成，用于遥感领域的尝试）

qq_43456016的博客

08-13

2293

无条件生成型的一种流行应用，它生成的图像看起来像用于训练的数据集中的图像。与文本或图像到图像模型不同，。它只生成与其训练数据分布相似的图像。通常，通过在特定数据集上微调预训练模型可以获得最佳结果。本教程主要来自官方教程，结合一些自己的修改，以支持训练本地数据集。我们首先依据官方教程，利用史密森尼蝴蝶数据集的子集上从头开始训练，以生我们自己的的。最后因为我是搞遥感方向的（测绘小卡拉米），所以利用进行训练尝试，遥感影像使用的是煤矿区的无人机遥感影像，主要就是裸地和枯草，有的还有一些因为煤矿开采导致的地裂缝。

【opencv】图像分割算法及基于轮廓的字符分离

m0_59405106的博客

08-10

3581

图像分割是指根据灰度、色彩、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域。