- 博客(166)
- 资源 (42)
- 收藏
- 关注
原创 BRISK特征提取,如何实现毫秒级的图像匹配?
该算法巧妙地结合了FAST特征点检测的高效性与二进制描述子(如BRIEF)的快速匹配优势,同时通过尺度空间金字塔和灰度梯度信息来增强其尺度与旋转不变性,使其在保持较高鲁棒性的同时,拥有极快的计算和匹配速度。:使用基于CNN的特征点检测器(如SuperPoint)替代传统的FAST检测器,可以获取更稳定、可重复性更高的特征点位置,提升整体流程的鲁棒性。:将BRISK二进制描述子与其他互补的特征(如颜色直方图、边缘信息或轻量级CNN特征)进行融合,形成混合描述子,以提升在特定场景下的性能。
2025-12-23 22:26:54
411
原创 LBP纹理特征提取:高鲁棒性的纹理特征算法
LBP(Local Binary Pattern,局部二值模式)是经典的局部纹理特征提取算法,核心逻辑是:对图像中每个像素,将其与周围邻域像素的灰度值比较(邻域像素>中心像素取1,否则取0),生成8位(3x3邻域)二进制编码,再将编码转换为十进制数作为该像素的“LBP值”。最终通过统计全图或局部区域的LBP值直方图,得到图像的纹理特征。
2025-12-23 12:03:27
570
原创 FREAK特征提取:SLAM与实时匹配的核心工具
FREAK(Fast Retina Keypoint)是模拟人类视网膜视觉机制的二进制特征提取算法,核心思想源于人眼“中央凹-周边”的非均匀采样模式:通过在高斯金字塔上构建多尺度的视网膜采样点网格,对比相邻采样点的亮度差异,生成固定长度(如512位)的二进制特征串。其设计目标是在保证特征区分度的同时,实现计算高效性与特征紧凑性。
2025-12-23 10:00:00
956
原创 特征匹配算法:ORB算法深度解析与实现
ORB(Oriented FAST and Rotated BRIEF)是一种快速的特征点检测与描述算法,它结合了改进的 FAST 关键点检测器与具有方向信息的 BRIEF 描述子。ORB 在保持较高匹配精度的同时,显著提升了计算速度,适用于实时性要求较高的视觉应用。ORB 算法主要用于在不同图像间快速检测并匹配关键点,建立图像之间的对应关系,是实现图像对齐、物体识别、视觉定位等功能的基础工具。,包含:机器学习,深度学习,大模型,CV方向,NLP方向,kaggle大赛,实战项目、自动驾驶等。
2025-12-22 12:12:18
195
原创 【82】同态滤波:解决光照不均与增强图像原理与Python实现
同态滤波是解决光照不均与细节增强的有效方法,其核心思想是将乘性模型转化为加性模型,在频率域分离并处理光照与细节分量。通过Python实现的同态滤波函数,我们可以灵活调整参数,适应不同场景的图像处理需求。无论是工业检测中的低光照零件图像,还是摄影中的逆光照片,同态滤波都能帮助你提取更清晰的细节,改善图像质量。赶紧尝试调整参数,看看你的图像能有多大提升吧!
2025-12-22 10:39:47
1343
原创 【81】Mean Shift分割:基于密度估计的无参聚类算法
无需手动指定簇数:完全由数据密度决定,适合未知分布的数据。支持任意形状簇:只要密度连续,不管簇是圆形、条形还是不规则形状,都能正确分割。鲁棒性强:对初始点的选择不敏感(通过合并质心修正)。
2025-12-22 09:30:00
694
原创 【80】暗通道去雾算法解析:从原理到Python实现
import cv2"""用形态学腐蚀实现最小值滤波,radius为滤波器半径"""暗通道去雾算法以“暗通道先验”为核心,通过数学模型推导和导向滤波优化,实现了高效的单图像去雾。其优势是无需额外硬件(仅需单张图像)、效果直观,缺点是对特定场景(如天空)的适应性有限。
2025-12-21 10:45:00
1256
原创 【79】背景建模:用于视频监控中的前景检测
本文聚焦视频运动目标检测的核心技术——颜色背景建模,详细讲解平均背景模型(含辅助背景改进方案)与单高斯背景模型的原理、流程及Python实现思路,对比两类算法的适用场景(如光照变化、微小运动),帮助读者理解基础背景建模的实践逻辑。
2025-12-21 09:00:00
1356
原创 【78】HOG+SVM行人检测实践指南:从算法原理到python实现
HOG+SVM是行人检测领域的经典算法,自2005年Dalal提出以来,一直是工业界和学术界的重要基线方法。本文将从四大维度,全面解析HOG+SVM的实践路径,同时覆盖红外行人检测的扩展应用,帮助读者从理论到工程实现掌握这一技术。
2025-12-20 10:30:00
621
原创 【77】积分图像:快速计算矩形区域和核心逻辑
积分图像是计算机视觉中的“预处理神器”——用一次遍历生成积分图,就能把后续的区域和计算从“慢遍历”变成“秒查询”。边界扩展:统一计算逻辑;递推公式:生成积分图像的核心;区域和计算:四个角点的组合魔法。如果你在做图像处理时遇到“反复计算区域和”的瓶颈,不妨试试积分图像——它可能会给你的代码带来数量级的速度提升!
2025-12-20 09:15:00
694
原创 【76】Haar特征的Adaboost级联人脸检测全解析及python实现
Haar-like特征是带黑白矩形块的模板,通过计算“白色区域像素和 - 黑色区域像素和”得到特征值。两矩形特征:用于捕捉眼睛(黑)与脸颊(白)的明暗差异;三矩形特征:用于捕捉鼻梁(白)与两侧眼睛(黑)的差异;对角线特征:用于捕捉45度方向的纹理(如眼角)。Viola最初提出的基础特征(如两矩形、三矩形)与Rainer扩展的旋转特征,共同构成了Haar分类器的特征库积分图是与原始图像同尺寸的二维数组,其中xy(x,y)xy位置的值是原始图像左上角到xy(x,y)xy的像素和SA。
2025-12-19 11:00:00
595
原创 【75】EDLines实时线段检测算法原理与Python实践
在计算机视觉中,线特征是理解场景结构的关键(如车道线、建筑轮廓、机械零件边缘)。但传统方法(如Hough变换、LSD)要么需要反复调整阈值(累加器阈值、线段长度阈值),要么难以兼顾速度与 accuracy。无需参数调整:通过统计图像自身梯度分布自动确定阈值,适配所有图像类型;实时性:线性时间复杂度(O(N),N为像素数),支持高分辨率图像的实时处理;低假阳性:通过梯度方向一致性与线段质量评估,过滤噪声与伪线段。
2025-12-19 09:00:00
1836
原创 【74】LSD直线检测算法详解与Python实现
本文深入解析LSD(Line Segment Detector)直线检测算法——一种以为核心优势的计算机视觉算法。它通过梯度计算提取像素边缘方向,用区域生长构建线支持区域,结合亥姆霍兹原理和contrario方法验证矩形候选,最终输出可靠直线段。文中不仅拆解算法每一步的数学逻辑,还提供完整Python实现,助力从理论到实践的无缝衔接。
2025-12-18 11:00:00
1430
原创 【73】Fisher Vector不等长特征归一化技术详解
px∑k1KπkNx∣μkΣkpxk1∑KπkNx∣μkΣkpxp(x)px:数据点xxx的概率密度;KKK:高斯分量的数量(比如64个,数量越多拟合效果越好,但计算量越大);πk\pi_kπk:第kkk个高斯分量的权重(满足∑k1Kπk1∑k1Kπk1且0≤πk≤10≤πk≤1Nx∣μkΣkNx∣μkΣk。
2025-12-18 09:00:00
936
原创 【72】VLAD技术实践:从局部描述符到高效帧表示的视频特征聚合与降维
本文围绕局部聚合描述符(VLAD)展开,解析其作为Fisher Kernel非概率版本的特征聚合逻辑,详细说明从局部描述符到VLAD向量的构建步骤,并对比PCA与稀疏矩阵两种降维方法在帧描述符优化中的应用,为大规模视频搜索的特征表示提供实践参考。
2025-12-17 10:30:00
935
原创 【71】Gabor滤波器:纹理提取与缺陷检测解析与Python实现
本文深入解析Gabor滤波器的原理与OpenCV-Python实现,通过三个实战案例,展示其在纹理特征提取与缺陷分析中的强大能力。我们将从Gabor函数的数学定义出发,逐步讲解核生成、多方向滤波、结果融合的完整流程,最终实现高精度的缺陷检测。
2025-12-17 09:00:00
973
原创 【70】HOG特征详解:从原理到Python实现的行人检测核心技术
方向梯度直方图(Histogram of Oriented Gradient, HOG)是计算机视觉中物体检测的经典特征描述子,通过统计图像局部区域的梯度方向密度分布,来刻画目标的外观与轮廓。2005年法国学者Dalal在CVPR上提出的「HOG+SVM」行人检测框架,至今仍是许多检测算法的基础——即使深度学习兴起,HOG的“局部统计+归一化”思想仍被轻量化模型借鉴。HOG特征的本质,是通过“局部细胞单元的梯度直方图+块归一化+全局拼接”,将图像的形状特征转化为高维向量。
2025-12-16 11:00:00
860
原创 【69】灰度共生矩阵(GLCM)原理拆解【超简单】
GLCM的本质是一个方阵,大小为灰度等级L×L(比如8级灰度的图像,GLCM是8×8矩阵)。矩阵中的元素PijP(i,j)Pij从灰度为i的像素出发,沿某个固定方向(比如水平右邻)、固定距离(比如1个像素)的相邻像素灰度为j的概率。用公式更严谨的表达:对于图像IxyI(x,y)Ixy,取偏移量dxdy(dx, dy)dxdy(比如水平方向dx1dy0dx=1, dy=0dx1dy0,垂直方向dx0dy1dx=0, dy=1dx。
2025-12-16 09:00:00
935
原创 【68】颜色直方图详解与Python实现
颜色直方图是计算机视觉的基础工具,OpenCV-Python的函数简化了计算流程。通过本文的代码示例,你可以快速实现RGB与HSV空间的直方图计算与可视化——在实际应用中,HSV空间更适合颜色相关的任务(如目标跟踪、颜色分割),而RGB空间更适合基础图像处理(如显示、格式转换)。
2025-12-15 15:15:39
668
原创 【资料分享】机器视觉学习资料(视频+源码+路径)
分享一套。资料内容包括:机器学习,深度学习,大模型,CV方向,NLP方向,kaggle大赛,实战项目、自动驾驶等。大家根据需要自行。
2025-12-15 09:31:21
1948
原创 【67】局部二值模式(LBP)从纹理特征提取到旋转不变性详解
局部二值模式(Local Binary Patterns,简称LBP)是T.Ojala等人1996年提出的结构法纹理特征算子用中心像素的灰度值作为阈值,将邻域像素二值化后编码,用十进制数值表示局部纹理的“结构特征”。光照鲁棒性:仅关注邻域与中心的相对灰度关系,不受整体光照变化影响;计算高效:仅需邻域比较与二进制编码,实时处理场景(如工业检测、目标追踪)友好;无参数依赖:无需预先假设纹理分布,工程落地成本低。gcg_cgc:中心像素的灰度值;
2025-12-14 10:00:00
1501
原创 【66】RootSIFT特征匹配的算法详解与Python实现
数据库预处理:对所有数据库图像提取RootSIFT特征,存储为特征库;查询处理:对查询图像提取RootSIFT特征;特征匹配:用(快速近似最近邻)匹配查询特征与数据库特征;结果排序:根据匹配的特征数量或平均距离,返回Top-N相似图像。
2025-12-14 09:30:00
915
原创 【65】GLOH描述子详解:从SIFT进化到更鲁棒的局部特征表示
GLOH作为SIFT的改进版,通过对数极坐标分区增强了局部结构的多尺度表示,结合PCA降维优化了特征向量的判别性。实验证明,它在复杂场景下的匹配精度优于SIFT、PCA-SIFT等传统方法,是图像匹配、目标识别的有力工具。未来,GLOH的框架可与深度学习结合(如用CNN替代手工设计的梯度直方图),进一步提升特征的表达能力。对于计算机视觉从业者来说,理解GLOH的设计思路,有助于更深刻地把握“局部特征”的核心——用更贴合视觉感知的方式,编码图像的不变性结构。
2025-12-13 11:30:00
1381
原创 【64】局部特征提取:DAISY高斯卷积优化分块策略
本文整理了DAISY局部图像描述子的学习思考——它延续SIFT“分块统计梯度方向直方图”的核心思想,通过,解决了SIFT稠密特征提取的耗时问题,且经机器学习验证为当前最优的特征汇聚方案。文中对比两者差异,解析DAISY的效率优势,也保留了未明细节待后续填补。作为刚接触DAISY的学习者,我想把目前摸透的内容写下来——一来巩固认知,二来给未来的自己留个“填坑指南”(比如高斯核参数怎么调、梯度通道数的影响,这些细节还没搞懂)。
2025-12-13 10:00:00
826
原创 【63】特征匹配:LATCH二值描述符的原理与Python实现
本文围绕2015年CVPR提出的LATCH(Learned Arrangements of Three Patch Codes)二值特征描述符展开,解析其对传统二值描述符的优化思路——用像素块比较替代点对比较以平衡速度与唯一性。结合OpenCV-Python,我们将完整实现LATCH特征匹配流程,并通过实验结果展示其“速度-精度”折中的性能定位。
2025-12-12 14:24:32
724
原创 【62】BRISK特征提取算法详解,从原理到Python实现
BRISK算法通过多尺度金字塔主方向对齐和二进制编码,实现了高效、鲁棒的特征提取与匹配。本文从原理到Python实现的完整指南,帮助读者快速掌握BRISK的核心逻辑,并应用于图像配准、目标跟踪等任务。
2025-12-12 14:09:03
738
原创 机器视觉学习路径路径整理
作为一位从业十年的AI算法工程师。今天给大家整理分享一套从OpenCV到深度学再到大模型的学习路径和学习资料。资料内容包括:机器学习,深度学习,大模型,CV方向,NLP方向,kaggle大赛,实战项目、自动驾驶等。大家根据需要自行。
2025-12-10 12:16:49
1454
原创 【61】FAST角点检测:从原理到Python实现
FAST对“角点”的判定回归最基础的观察:若一个像素与周围足够多的邻域像素存在显著灰度差异,则它很可能是角点。这种“返璞归真”的定义,让FAST避免了SIFT那样的多尺度空间构建、Harris那样的二阶矩矩阵计算,直接从“像素对比”出发,大幅减少计算量。
2025-12-10 09:30:00
1635
原创 【60】视频插帧:DeepVoxelFlow融合光流与CNN的视频帧合成新范式
3D体素流( F )是网络的核心输出,包含空间运动信息与时间混合权重空间运动成分:表示目标帧到下一帧的2D光流,其负值对应目标帧到前一帧的光流(假设光流在时间上线性对称)。时间混合成分:表示前一帧与后一帧的像素混合权重,用于融合两帧像素生成目标帧。FFmotionFmaskFFmotionFmask其中,Fmotion∈RH×W×2Fmotion∈RH×W×2)(H、W为帧高宽),Fmask∈RH×W×1F。
2025-12-09 19:53:48
948
原创 【59】3D尺度不变特征变换(SIFT3D):医学影像关键点检测的核心算法与实现
SIFT3D通过尺度空间处理和三维梯度分析,解决了医学影像的关键点检测问题,其768维描述符为后续的影像匹配、重建提供了强鲁棒的特征基础。相比Harris3D等算法,SIFT3D的尺度不变性使其在医学影像的“多分辨率分析”中更具优势——无论是局部病灶的细节,还是整体器官的结构,都能准确提取特征点。
2025-12-09 19:31:34
1539
原创 【58】经典SGM立体匹配解析:视差计算与优化的核心逻辑
本文聚焦经典立体匹配算法SGM(Semi-Global Matching)的核心输出环节——视差计算与优化,详细解析赢家通吃(WTA)算法的原理、错误匹配剔除的三类常用方法、亚像素精度提升的二次曲线内插技术,以及兼顾效率与边缘保持的噪声抑制策略,为理解SGM如何从聚合代价矩阵生成可靠视差图提供清晰指引。视差计算(WTA)用“最小代价”原则快速生成初始结果;视差优化用“错误剔除→精度提升→噪声抑制”的三步策略,将初始结果打磨为可靠、精确、干净的视差图。
2025-12-08 14:30:00
649
原创 【57】条纹结构光三维重建:从双目匹配到相位解算的核心技术解析
在近景三维重建领域,结构光技术凭借高精度与抗弱纹理干扰的特性,成为工业工件检测、逆向工程等场景的“标配”。不过,复杂室外环境(如强光、动态干扰)仍会影响其性能。目前结构光主要分为线结构光与条纹结构光两类——前者适合轮廓扫描,后者更擅长面阵式三维重建。本文将从条纹结构光入手,揭示其从原理到关键技术的完整逻辑。
2025-12-08 09:30:00
634
原创 【56】图像质量评估经典指标:PSNR与SSIM的原理及Python实践
本文聚焦图像质量评估的两大核心指标——PSNR(峰值信噪比)与SSIM(结构相似性),从数学原理出发,结合Python代码实现,剖析两者的优势与局限。无论是图像压缩、复原还是超分辨率任务,理解这两个指标能帮助你更准确地衡量算法效果,避免“指标好看但视觉效果差”的尴尬。用PSNR快速筛选候选算法;用SSIM验证算法的视觉效果。理解两者的原理与局限,能帮助你在实际任务中更准确地衡量图像质量。
2025-12-07 14:00:00
961
原创 【55】图像相似搜索:Hash感知哈希算法的原理与代码实现
感知哈希算法:一种将图像转化为“数字指纹”的相似性匹配技术。通过缩小尺寸、简化色彩、计算灰度均值等五步流程,生成固定长度的图像指纹,再通过汉明距离量化指纹差异,实现快速相似性判断。我们将拆解算法细节,给出极简Python实现,并探讨其优缺点及工业级扩展方案。
2025-12-07 09:30:00
1266
原创 【54】全景拼接:基于SIFT与RANSAC的Python实现教程
本文介绍计算机视觉中全景拼接的核心原理与工程实现,涵盖单应性矩阵、SIFT特征匹配、Lowe比率测试、RANSAC算法等关键技术,并提供完整Python代码示例,演示从图像读取、特征匹配到全景生成的全流程。SIFT特征检测:解决旋转、缩放不变性问题;Lowe比率测试:过滤错误匹配;RANSAC算法:估计可靠的单应性矩阵。通过调整ratio(Lowe阈值)与(RANSAC重投影阈值),可适配不同场景的拼接需求。若需处理多图拼接,只需将图像按顺序传入函数(需保证相邻图像重叠)即可。
2025-12-06 14:30:00
563
原创 【53】基于RANSAC的图像全景拼接
本文聚焦图像全景拼接中的核心难题——特征匹配噪音,介绍RANSAC这一稳健迭代算法的原理,解释其如何通过随机取样、模型验证分离内群数据与离群干扰,为全景图的准确拼接提供关键支撑。图像全景拼接的本质,是用数学模型描述图像间的变换关系——而模型的准确性,完全依赖输入数据的“纯度”。RANSAC的价值,就在于它能在“噪音占比高达50%”的极端情况下,依然找到正确的模型。
2025-12-06 10:00:00
919
原创 【52】均值漂移(MeanShift)算法原理解析与代码实现
本文系统解析均值漂移(MeanShift)算法,从“沿密度上升寻聚类”的核心逻辑切入,推导基础运算公式与核函数改进版,结合聚类、图像分割等典型应用,拆解完整运算步骤,帮助理解其原理与实践价值。均值漂移是一种直观且强大的密度聚类算法,从“漂移找密度极点”的核心逻辑出发,通过公式推导与核函数改进,解决了等权值的缺陷,广泛应用于聚类、图像分割、目标跟踪等领域。理解其原理与步骤,能更好地将其应用于实际问题中。
2025-12-05 14:00:00
1299
原创 【51】图像分割:Snake主动轮廓模型原理、演化与代码实现
本文聚焦图像分割中的经典方法——Snake主动轮廓模型,从曲线演化的基础理论切入,解析其“能量最小化”的核心逻辑:通过内部力(弹性能、弯曲能)保持轮廓光滑,外部力(图像梯度)引导向目标边缘收敛。结合MATLAB代码演示其迭代过程,帮助理解这一自顶向下分割方法的工作机制。Snake模型用一条闭合参数曲线vsxsyss∈01vsxsys)]s∈01其中s是曲线的参数化变量(如傅里叶边界描述)。曲线的总能量函数Etotalv∫01α∥v′s。
2025-12-05 09:30:00
765
原创 【50】OpenCV背景减法技术解析与实现
本文介绍OpenCV中背景减法核心技术,它通过静态相机生成运动物体的二值前景掩模,是视频目标检测的关键预处理手段。文中涵盖KNN、MOG等四种算法,解析其流程逻辑,并结合C++ Demo演示实际效果。
2025-12-04 12:06:01
787
原创 【49】OpenCV模板匹配原理与实战
模板匹配是对象检测领域最简单的方法之一——只需几行核心代码、计算效率高,还不用先做阈值化或边缘检测。但它也有明显局限:如果目标存在旋转、缩放或视角变化,匹配结果就会失效。此时需改用HOG+SVM、YOLO、Faster R-CNN等高级检测器。而当目标姿态固定时,模板匹配能完美发挥作用。模板匹配本质是“找相同”:你有一张模板图(包含要检测的目标),和一张源图(要找目标的图)。然后把模板图在源图上从左到右、从上到下滑动,每滑到一个位置,就计算模板与源图对应区域的相似度。相似度最高的位置,就是目标所在处。
2025-12-04 09:30:00
520
Delicious数据集
2017-09-11
vgg_generated_120.i等文件.zip
2021-01-16
OPENGL资源.zip
2019-12-18
arm-linux-gcc-4.4.3安装包及安装教程
2016-07-24
Mediamill数据集
2017-09-11
OpenGL_Shader_Demo鱼眼校正
2019-12-25
暗图与雾图增强Frankle-McCann Retinex python代码
2025-11-27
Elecard StreamEye Tools 2.9.1.zip
2021-07-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅