自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 收藏
  • 关注

原创 OpenCV计算机视觉实战(33)——文字识别详解

本节围绕实际 OCR 系统构建,系统讲解了从文本区域检测、图像预处理、字符识别到结构化信息提取的完整流程。通过引入 EAST 模型、图像多尺度与旋转补偿策略,有效提升了文本检测的召回率与准确性;结合形态学与行排序技术,优化了 ROI 的提取质量;在 Tesseract 集成中,通过二值化增强、字符白名单与批量识别等手段,提高了字符识别的稳定性与效率。最后通过发票识别案例,展示了如何将 OCR 结果转化为结构化数据,为实战项目提供思路。

2025-12-22 16:31:59 818 1

原创 OpenCV计算机视觉实战(32)——YOLO目标检测

目标检测作为计算机视觉的核心任务之一,在自动驾驶、智能监控、工业质检等领域具有广泛应用。在众多目标检测算法中,YOLO (You Only Look Once) 系列以其独特的单阶段检测架构和卓越的实时性能脱颖而出。本节将系统剖析 YOLO 系列的发展历程与技术演进,重点讲解 YOLOv3 和 YOLOv5 的架构设计、实现原理及 OpenCV 工程实践。

2025-11-28 10:03:40 1032 2

原创 OpenCV计算机视觉实战(31)——人脸识别详解

本节系统介绍了基于 OpenCV 构建端到端人脸识别系统的完整流程。首先通过 DNN 模型与 KCF 跟踪器融合,实现高效稳定的人脸检测与关键点定位;接着利用 Torch 加载轻量级 FaceNet 网络,对齐人脸并提取归一化特征编码,实现欧氏距离与余弦相似度的人脸精确比对;最后引入眨眼检测、头部姿态估计和轻量级 CNN 模型,构建多模态融合的活体检测机制,有效防御照片与视频伪造攻击。

2025-11-21 09:56:00 989 2

原创 OpenCV计算机视觉实战(30)——图像分类模型

本节将深入探讨计算机视觉和深度学习领域,重点关注图像分类技术。图像分类使用先进的机器学习模型将图像分类到不同的类别中。在本节中,我们将探讨多种图像分类架构,包括 ResNet、InceptionV3、MobileNetV2 等。通过了解这些架构及其实现方式,了解分析、预处理和分类图像的工具。

2025-11-18 09:44:55 741 1

原创 OpenCV计算机视觉实战(29)——OpenCV DNN模块

OpenCV DNN 模块为将深度学习模型集成到计算机视觉项目中提供了一个强大而灵活的工具。通过支持多种框架、预训练模型和硬件加速,可以轻松地处理各种任务。在了解模块的限制的同时,学习了 OpenCV DNN 模块支持的层和重要类。利用这些知识,我们就能够充分利用深度学习和计算机视觉的潜力,为计算机视觉应用开发奠定基础。

2025-11-07 15:32:11 1230 1

原创 OpenCV计算机视觉实战(28)——深度学习初体验

在本文中,我们深入探索了 OpenCV 的 DNN 模块如何助力深度学习模型的高效部署与推理。首先,借助 cv2.dnn 对多种主流模型格式(如 Caffe、ONNX、Torch) 进行了加载与分类推理,掌握了图像预处理、前向传播及结果解析等关键流程,并介绍了批量推理与 GPU 加速等优化手段。随后,结合 YOLOv3 模型实现了实时多尺度目标检测,展示了如何提取输出层、进行后处理、绘制检测框及计算帧率等技巧。最后,我们使用风格迁移模型对图像进行了艺术化处理,轻松实现油画风格转换。

2025-11-03 14:57:58 1058

原创 OpenCV计算机视觉实战(27)——深度学习与卷积神经网络

深度学习已经彻底改变了人工智能,在计算机视觉、自然语言处理和机器翻译等领域取得了显著进展。本节探讨了深度学习的多种架构方法,如卷积神经网络 (convolutional neural network, CNN),介绍了它们的数学基础、优势和应用。此外,本节介绍了深度学习中的训练和推理过程,重点介绍了用于高效和准确预测的技术,介绍了优化函数、激活函数和模型压缩技术在提高推理速度、减少计算需求和确保鲁棒性方面的重要性。

2025-10-21 09:31:57 1199 1

原创 OpenCV计算机视觉实战(26)——OpenCV与机器学习

通过本节的学习,我们完成了从图像数据提取到机器学习模型训练与评估的完整闭环。K-Means 帮助我们理解聚类在图像色彩空间的应用;SVM 通过强大的分类边界与调参机制展示了其在图像识别中的潜力;而决策树不仅可解释性强,还通过剪枝与特征重要度揭示了模型如何“看待”图像。

2025-10-13 11:25:09 817 5

原创 OpenCV计算机视觉实战(25)——立体视觉详解

在本文中,介绍了双目立体视觉的完整流程:相机标定与图像校正确保左右图像的极线对准;StereoSGBM 与 WLS 滤波为视差图提供高质量输入;重投影矩阵 Q 让三维坐标重构变得简单易行;交互式测距系统则将这些算法集成于一体,实现了对场景中任意点的实时距离查询。

2025-09-16 10:44:20 1442 7

原创 OpenCV计算机视觉实战(24)——目标追踪算法

在本文中,我们从 MeanShift 的色彩直方图密度搜索出发,深入剖析了其多通道建模与动态模型更新技巧,又在 CamShift 中加入了背景均衡、椭圆可视化和自适应迭代策略,显著提升了跟踪的精度与鲁棒性。最后,探讨了多目标追踪,通过这些实践,了解了从单目标到多目标、从传统算法到深度检测器融合的完整追踪管线,能够在复杂视频场景中稳定地识别、定位并持续追踪各类移动目标。

2025-09-10 15:02:44 1429 4

原创 OpenCV计算机视觉实战(23)——目标检测详解

本文系统梳理了基于传统机器学习方法的目标检测技术,涵盖从 HOG + SVM 到 Haar 级联分类器的应用与优化,并进一步拓展至自定义分类器的训练实战。在具体实现中,介绍了滑窗、多尺度检测的基础流程,还引入了非极大值抑制、ROI 加速、级联细化检测等提升检测效率和精度的关键策略。此外,通过训练自定义 HOG + SVM 模型,读者可以灵活应对特定场景下的目标识别任务,为构建轻量、高效的视觉系统奠定坚实基础。

2025-09-02 13:17:54 1266 2

原创 OpenCV计算机视觉实战(22)——图像拼接详解

图像拼接是一项融合特征匹配、几何变换与图像融合等多项技术的综合性任务。本文首先讲解了如何通过 SIFT 或 ORB 特征提取配合 RANSAC 估算单应性矩阵,实现图像之间的精确配准。接着介绍了透视变换与线性融合的基础流程,并进一步引入曝光补偿与多频段融合策略,提升拼接结果的无缝性与视觉质量。通过合理组织模块并优化细节,最终可构建出一个高鲁棒性、高质量的自动全景图拼接系统。

2025-08-28 12:53:02 1436 2

原创 OpenCV计算机视觉实战(21)——模板匹配详解

本文围绕模板匹配在实际场景中的应用展开,重点解决了目标因尺度变化与角度旋转所带来的匹配难题。首先通过多尺度模板匹配策略,使得模板在不同缩放比例下都能与场景图像进行有效比对,从而应对目标大小不一致的问题;接着引入旋转不变性匹配,通过对模板进行角度遍历旋转,实现了对任意方向目标的稳健识别;最后在零件定位实战中,将这两者有机结合,构建了一个既能适应尺度变化又能处理旋转干扰的鲁棒匹配系统。

2025-08-25 09:59:30 1417 4

原创 OpenCV计算机视觉实战(20)——光流法运动分析

在视频分析与动态视觉系统中,光流 (Optical Flow) 技术是一种关键的运动估计方法。它通过分析连续帧之间像素强度的变化,估计图像中每个像素的运动方向与速度,从而重建出视觉世界中的动态场景。光流技术主要分为稀疏光流和稠密光流两种类型。稀疏光流(如 Lucas–Kanade 方法)关注图像中的少量特征点,适合实时目标跟踪;而稠密光流(如 Farneback 方法)则估计每个像素的运动矢量,适合整体运动场分析与背景补偿。

2025-08-19 17:23:59 1207 2

原创 OpenCV计算机视觉实战(19)——特征描述符详解

通过本文的介绍,我们系统回顾了从经典的 SIFT / SURF 到轻量级 ORB 的特征提取与描述方法,并结合特征匹配与 RANSAC 实现了鲁棒的图像几何校正。SIFT / SURF 在处理复杂纹理与尺度变化时具有极高的稳定性,而 ORB 则以其高效与可嵌入性,在实时场景中表现出色。最后,通过合理的匹配策略与 RANSAC 的离群点剔除机制,我们能够在嘈杂背景下提取出可靠的点对,实现图像的精准配准与后续处理。特征描述子的合理选择与匹配策略的优化,是构建高效视觉系统的关键基础。

2025-08-11 17:35:06 937 2

原创 OpenCV计算机视觉实战(18)——视频处理详解

本文围绕视频处理的三个核心环节——读写帧处理、运动检测与摘要生成,构建了一个基于 Python + OpenCV 的完整视频分析工作流。通过帧级并发处理提升效率,利用背景差分法精准提取动态目标,并融合图像特征与聚类方法高效生成视频摘要,为多媒体内容理解奠定基础。

2025-08-04 11:52:05 1484 4

原创 OpenCV计算机视觉实战(17)——特征点检测详解

在计算机视觉中,角点 (`Corner`, 也称特征点) 是图像中特征信息最丰富的点,对应周围像素灰度在两个正交方向均有显著变化。准确检测并定位角点,对于后续的图像配准、运动跟踪和三维重建等任务至关重要。本文将介绍并实现经典的 Harris 角点检测、改进的 Shi-Tomasi 算法以及亚像素级角点优化。

2025-07-24 10:52:13 1512

原创 OpenCV计算机视觉实战(16)——图像分割技术

本节从分水岭的高程地图思路切入,讲解如何借助距离变换与连通组件构建水漫分割,再通过 GrabCut 的图割模型与用户交互实现更高精度的前景去背,最后以 FloodFill 的种子驱动方式演示快速区域生长。三者各有侧重,却可互为补充:分水岭适合自动化预分割,GrabCut 适合复杂边缘细化,FloodFill 则胜在简单直观和交互式应用。

2025-07-21 10:54:22 1370 7

原创 OpenCV计算机视觉实战(15)——霍夫变换详解

本文介绍了霍夫变换在图像处理中的三大应用:1) 直线检测:通过Canny边缘检测和HoughLinesP提取特定角度的线段,适用于建筑分析和文档处理;2) 圆形检测:利用HoughCircles结合参数优化,可精准定位工业零件和医学影像中的圆形目标;3) 车道线检测:综合颜色筛选、ROI裁剪、透视变换和多项式拟合实现车道识别。

2025-07-14 11:17:02 1057 1

原创 OpenCV计算机视觉实战(14)——直方图均衡化

在本文中,我们系统性地介绍了 CLAHE 自适应直方图均衡化、直方图反向投影以及基于颜色追踪的目标定位系统。这些方法不仅能显著增强图像的视觉质量,还能为实际工程项目提供稳健的技术支撑。CLAHE 通过分块与对比度限幅,有效提升了局部细节;反向投影利用颜色概率分布快速筛选目标区域;颜色追踪系统则将上述方法综合运用,实现了可扩展的动态目标跟踪方案。

2025-06-30 16:08:19 1513

原创 OpenCV计算机视觉实战(13)——轮廓检测详解

轮廓不仅是图像边缘的集合,更是图像理解的“骨架”。在本节中,我们深入探讨了轮廓层级的结构关系、凸包与缺陷的形状分析技巧,以及面积、周长、几何矩等轮廓特征的提取与应用。这些技术为图像分析提供了更丰富、更高维的语义信息。

2025-06-26 08:54:37 1439 5

原创 OpenCV计算机视觉实战(12)——图像金字塔与特征缩放

图像金字塔技术通过对原始图像按不同分辨率进行多层次表示,不仅能提升计算效率,还能为图像融合、检测与识别提供多尺度特征。高斯金字塔 (Gaussian Pyramid) 用于构建多级低通图像,拉普拉斯金字塔 (Laplacian Pyramid) 则提取各层之间的细节信息。本节将深入介绍如何使用 OpenCV 构建高斯与拉普拉斯金字塔,并以经典的图像融合案例,展示图像金字塔在特征缩放与融合中的强大应用。

2025-06-23 09:12:29 1274 1

原创 OpenCV计算机视觉实战(11)——边缘检测详解

在本节中,我们系统介绍了三大经典边缘检测算子,包括 Sobel 算子:一阶导数平衡了噪声抑制与边缘提取,结合方向信息可用于纹理分析与车道检测;Laplacian 算子:二阶导数对微小亮度突变尤为敏感,配合零交叉和细化技术,可精确捕捉任意方向的细节边缘;Canny 算法:集成多阶段处理与双阈值策略,通过多尺度融合与自适应阈值优化,达到抗噪与细节兼顾的卓越效果。

2025-06-18 09:26:25 4220 9

原创 OpenCV计算机视觉实战(10)——形态学操作详解

在本节中,我们介绍了腐蚀与膨胀:理解了结构元素的形状与尺寸如何影响图像噪声去除与连通性增强;开运算与闭运算:掌握了“先破后立”与“先立后破”的组合套路,轻松去除斑点与填补空洞;形态学梯度与骨架提取:学会了如何从二值图中提取清晰的边缘轮廓,并将复杂形状瘦身为一像素宽的中轴线。在实际项目中,我们可以根据噪声类型和应用需求,自由组合这些操作:先用开运算去噪,再用闭运算恢复结构,或在边缘检测和形状分析前加入梯度与骨架处理。

2025-06-04 09:19:27 1510 1

原创 OpenCV计算机视觉实战(9)——阈值化技术详解

在图像处理领域,阈值化 (Binarization) 技术就像一把魔术剪刀,能够将复杂的灰度图像一分为二,提取出关键的前景信息。无论是光照均匀的实验室拍摄,还是手机拍摄的阴影斑驳文档,选择合适的阈值化方法都至关重要。本文将介绍 OpenCV 中的三大阈值化法——全局阈值、自适应阈值与 Otsu 算法,剖析它们的原理与优缺点,并通过一个真实的文档扫描案例演示如何在实际场景下灵活组合与应用。

2025-05-29 08:32:39 1792

原创 OpenCV计算机视觉实战(8)——图像滤波详解

在本节中,我们从线性滤波(均值/高斯)的原理与参数调优入手,紧接着以非线性滤波(中值/双边)为重点,探讨了它们在各自噪声模型下的卓越表现与局限,最后,通过自定义卷积核实践,介绍如何使用 cv2.filter2D 实现锐化、边缘检测等多样效果。

2025-05-26 08:26:20 2326 2

原创 OpenCV计算机视觉实战(7)——色彩空间详解

本文深入探讨了三种常见色彩空间:RGB/BGR、HSV 与 CIELAB,并介绍了 OpenCV 中色彩空间转换的方法与原理 。在 HSV 与 Lab 空间部分,演示了如何利用 HSV 进行色彩分割,以及使用 Lab 空间进行颜色校正与色差分析。最后,展示了如何使用 cv2.calcHist 计算颜色直方图,并结合 Matplotlib 对 BGR 通道直方图进行可视化分析,以支持图像增强和基于颜色的检索任务 。

2025-05-22 08:28:02 2059 1

原创 OpenCV计算机视觉实战(6)——经典计算机视觉算法

计算机视觉是一个多学科交叉领域,目标是使机器能够理解和解释来自图像和视频的视觉信息。本节将介绍经典计算机视觉算法的关键原理、应用、优势和局限性,即使是在深度学习技术的出现之后,这些算法仍然具有重要意义,为图像分析、特征提取、分割、运动估计和目标检测奠定了基础。并在特定领域内对不同算法进行比较分析,展示经典算法在实际场景中的应用。

2025-05-19 08:19:41 2832 2

原创 OpenCV计算机视觉实战(5)——图像基础操作全解析

在本文中,我们首先从最底层的像素与 ROI 操作入手,理解了如何高效访问与修改图像数据;继而通过通道分离与合并,掌握了色彩处理与对比度增强的技巧;最后借助仿射与透视变换,实现了从基础平移、旋转到复杂校正的完整流程。

2025-05-15 11:13:28 1308 1

原创 OpenCV计算机视觉实战(4)——计算机视觉核心技术全解析

在本节中,介绍了计算机视觉中的常见任务。从讨论计算机视觉中的常见挑战开始,介绍了图像分类、检测和定位图像中对象、使用分割技术获取图像中的细粒度信息,最后讨论了光学字符识别。

2025-05-09 08:40:50 1215 2

原创 OpenCV计算机视觉实战(3)——计算机图像处理基础

本文全面介绍了计算机视觉和数字图像处理的基础知识。从最基本的像素概念入手,详细讲解了图像在计算机中的表示方式,包括RGB、CMYK等色彩空间的工作原理及其应用场景。还系统分析了常见图像和视频文件格式的特点,梳理了计算机图像处理技术的发展历程,并重点介绍了OpenCV这一强大的开源计算机视觉库的功能与应用领域。

2025-05-07 09:03:31 1547 4

原创 OpenCV计算机视觉实战(2)——环境搭建与OpenCV简介

OpenCV (Open Source Computer Vision Library) 是一个开源计算机视觉库,广泛应用于图像处理、机器视觉、人工智能等领域。本文将手把手教你从环境搭建到运行第一个 OpenCV 程序,包含图像的读取、显示、保存,以及使用摄像头实时捕获图像的基础操作。

2025-04-28 08:32:12 1569 1

原创 OpenCV计算机视觉实战(1)——计算机视觉简介

本节从计算机成像的历史开始,介绍图像表示、处理和操作,还介绍了数字图像处理,并简要解释了数字图像处理与模拟图像处理之间的区别。

2025-04-24 09:46:22 1013 2

原创 Python图像处理【24】面部变形(face morphing)

面部图像处理是提取和分析人类面部信息的研究领域,人脸是图像处理中的最重要的对象之一。因此,在过去的几十年中,面部图像的自动处理和识别已经得到了研究人员的极大关注。在本节中,我们学习了如何使用 dlib 库执行面部变形操作。

2024-04-22 08:25:12 1684 10

原创 Python图像处理【23】分布式图像处理

分布式处理可以将位于不同地点的、或具有不同功能的、或拥有不同数据的多台计算机通过通信网络连接起来,在控制系统的统一管理控制下,协调地完成大规模信息处理任务,利用分布式处理可以提高信息处理速度。在本节中,我们学习了如何使用 Dask 完成分布式图像处理,从而提高图像处理速度。

2024-03-18 08:29:30 1307 11

原创 Python图像处理【22】基于卷积神经网络的图像去雾

图像去雾已成为计算机视觉的重要研究方向,在雾、霾等恶劣天气下拍摄的的图像通常由于大气散射的作用,图像质量严重下降使颜色偏灰白色,对比度降低,物体特征难以辨认,还会影响图像的分析与处理。因此,需要使用图像去雾技术来增强或修复图像,以改善视觉效果并便于图像的后续处理。在本节中,我们学习了一种基于卷积神经网络的图像去雾模型,通过使用训练后的模型可以显著改善图像视觉效果。

2024-03-11 08:33:07 2054 39

原创 Python图像处理【21】基于卷积神经网络增强微光图像

在本节中,我们将学习如何基于预训练的深度学习模型执行微光/夜间图像增强。由于难以同时处理包括亮度、对比度、伪影和噪声在内的所有因素,因此微光图像增强一直是一项具有挑战性的问题。为了解决这一问题,提出了多分支微光增强网络 (multi-branch low-light enhancement network, MBLLEN),其关键思想是提取不同尺度的丰富特征,以便可以通过多个子网应用图像增强。最后,通过多分支融合生成输出图像,采用这种方式图像质量得到了极大的提高。

2024-03-05 08:09:52 1302 25

原创 Python图像处理【20】图像金字塔

图像金字塔是一种表达多尺度图像一种技术,是一种以多分辨率来解释图像的有效且简单的结构,通常而言,一幅图像的图像金字塔是一系列以金字塔形状(自下而上)分辨率逐步降低的图像集合(来源于同一张原始图的图像不同分辨率)。本节中,介绍了图像金字塔的基本概念,包括高斯金字塔和拉普拉斯金字塔,并利用图像金字塔实现了图像混合应用。

2024-02-28 08:00:10 1301 11

原创 [Python图像处理] 使用OpenCV创建色调图

色调映射将图像的强度改变到高水平或高动态范围,降低 HDR 图像的整体对比度以便于在具有较低动态范围的设备或打印输出上显示,并且可以应用于生成具有保留的局部对比度的图像。在本节中,我们将学习如何使用 OpenCV 函数在 HDR 图像上应用色调映射。

2024-02-05 08:15:16 1156 4

原创 [Python图像处理] 使用OpenCV创建对象显着图

显着图是显示每个像素独特质量的图像,显着图的目的是简化或将图像的表示形式更改为更有意义和易于分析的内容。在本节中,我们将学习如何使用 OpenCV 函数来使用静态显着性检测算法来定位图像的最显着区域。

2024-01-29 08:23:16 1069 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除