自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 收藏
  • 关注

原创 Python中如何实现一个程序运行时,调用另一文件中的函数

本文介绍了Python中调用其他.py文件函数的几种常见场景及实现方法。主要内容包括:1)同一目录下通过import或from...import导入模块;2)子目录中文件通过包名.模块名形式调用;3)非同级目录需先使用sys.path添加路径再导入。文章强调了命名规范、__name__ == "__main__"的作用、权限问题等注意事项,并指出要避免循环导入。核心是通过模块导入机制实现.py文件间的函数调用,适用于不同目录结构的Python项目开发。

2026-01-05 16:47:16 459

原创 对象包括一对一基础信息与一对多的多记录时,为什么JSON结构不要嵌套

本文对比了图书数据JSON格式设计的两种方案:嵌套方案(将销售记录嵌套在图书基本信息内)和同级拆分方案(基本信息与销售记录同级)。分析指出嵌套方案存在语义混淆、结构臃肿、扩展性差、不符合通用规范等问题,而同级拆分方案具有语义清晰、查询高效、易于扩展等优势。建议在大多数业务场景采用同级拆分方案,仅在极简单场景考虑嵌套方案。最终推荐使用同级拆分方案的结构设计,以实现更好的数据组织与维护效率。

2025-12-25 22:34:06 895

原创 Python处理 “列表套字典” 结构JSON数据的三种方式对比

本文介绍了处理JSON文件中"列表套字典"结构的三种优化方法:1)通过字典映射预处理建立索引,将查找时间复杂度降至O(1);2)使用生成器表达式快速定位目标数据;3)借助pandas库处理结构化大数据。针对不同数据规模,推荐小数据量直接遍历,大数据量采用字典索引或pandas方案。这些方法通过减少无效遍历或利用底层优化,有效提升了JSON数据的查找和修改效率。

2025-11-11 10:20:33 321

原创 漫谈《数字图像处理》之“定量 - 结构” 图像模式分类

冈萨雷斯的“定量-结构”二元分类框架是图像模式分类的基础理论范式。定量模式通过数值特征(如统计量、物理属性、模式向量等)区分图像,适用于基于可量化差异的任务;结构模式则通过分析基元间的空间关系(如拓扑、连接规则等)进行分类,适用于形状、布局等结构性差异的识别。该框架虽存在特征提取难度高、现代任务适配不足等局限,但其核心思想仍深刻影响着传统图像处理与深度学习时代的研究,为图像分析提供了清晰的理论基础和方法指导。

2025-09-26 12:30:54 996

原创 漫谈《数字图像处理》之图像模式识别的核心方法论

摘要:冈萨雷斯提出的“模式向量-空间点、模式类-超云”几何类比,为图像模式识别建立了可计算的认知框架。该范式将图像数据转化为n维空间中的几何对象,衍生出三大核心工具:距离度量相似性(欧氏、余弦等距离)、聚类实现无标签分组(K-Means、DBSCAN等算法)、分类边界完成监督决策(线性/非线性边界)。三者形成“度量-分组-决策”的递进逻辑,共同解决图像分类问题。这种几何视角不仅支撑传统算法,也与深度学习的特征学习目标一脉相承,成为连接经典方法与现代技术的思想桥梁。

2025-09-25 22:08:08 894

原创 漫谈《模式识别》从图像感知到通用智能的信号解读框架

本文系统梳理了模式识别的发展历程、核心逻辑和技术体系。模式识别作为AI感知能力的基础,经历了从早期机械匹配、学科形成、神经网络兴起、到深度学习主导四个阶段。其核心逻辑遵循“预处理-特征提取-分类决策”的通用框架,针对不同信号类型(图像、时序等)调整特征提取方式。技术体系分为传统人工特征方法和深度学习自动学习方法,后者已成为主流。模式识别与AI构成“感知基础-智能决策”的协同关系,未来将通过多模态融合等技术创新持续推动AI发展

2025-09-25 21:20:29 986

原创 漫谈《数字图像处理》之尺度不变特征变换算法(SIFT)

SIFT算法是传统计算机视觉中具有里程碑意义的局部特征提取方法,通过构建高斯金字塔、极值检测、方向赋值和生成128维描述子四个步骤,实现了对尺度、旋转和亮度变化的鲁棒性。该算法广泛应用于图像拼接、目标识别、视频跟踪等领域,解决了跨条件匹配的经典难题。尽管存在计算复杂度高的问题,但其技术范式为后续改进算法(如SURF、ORB)奠定了基础,并推动了特征提取从固定条件到跨条件鲁棒的思维转变。SIFT的设计逻辑至今仍对特征提取技术发展具有重要参考价值。

2025-09-25 09:01:15 989

原创 漫谈《数字图像处理》之有根的连通树(分量树)概念

摘要:分量树是图论中基于有根树的重要结构,具有“无环连通+根节点约束+分支分量组织”;三重特性。其核心价值在于通过唯一根节点实现层级化方向性,并通过分支分量实现结构归属与分解。分量树继承了树的无环性和连通性,同时具备严格父子关系和层级划分,各分支分量互斥且自洽。相比其他树结构,分量树专注于层级化分支归属,在图像处理、数据存储和拓扑建模等需要明确层级关系的场景中具有独特优势。其清晰的结构和解释性使其成为解决层级化问题的经典工具。

2025-09-24 22:42:25 1020

原创 漫谈《数字图像处理》之最大稳定极值区域(MSER)

MSER(最大稳定极值区域)是一种基于灰度分层分析的局部特征提取方法,通过动态阈值变化识别图像中具有稳定连通性的核心区域。其核心优势在于对光照变化、缩放和局部遮挡的强鲁棒性,在文字检测、目标匹配、医学图像分析等领域应用广泛。相比传统灰度特征提取,MSER输出几何结构特征而非统计值;与分水岭算法相比,它更侧重于筛选稳定区域而非全图分割。虽然存在对噪声敏感、无法直接提取边缘等局限性,MSER仍因其无需训练、解释性强的特点,在工业检测等实际场景中保持重要价值。

2025-09-24 22:23:49 956

原创 漫谈《数字图像处理》之特征提取技术通用分类

计算机视觉中的特征提取技术可从三个维度系统分类:按特征本质分为灰度、几何、纹理和颜色特征;按分析维度分为单尺度和多尺度方法;按技术范式分为传统手工设计和深度学习自动提取。其中多尺度几何特征是几何特征与多尺度分析的交叉方向。这种分类框架兼顾了逻辑性和全面性,可有效涵盖当前主流方法,为不同应用场景提供技术选择依据。

2025-09-24 22:10:47 1205

原创 漫谈《数字图像处理》之霍特林变换(Hotelling Transform)

霍特林变换是一种基于数据统计特性的降维技术,通过重新定义坐标轴实现高效去冗余。其核心逻辑分为三步:定位数据变化最剧烈的方向作为主坐标轴、构建正交坐标系、舍弃次要方向信息。该变换在图像处理中优势显著,能实现高保真压缩(如保留20%主成分即可缩减75%文件大小)和精准特征提取。与傅里叶变换、DCT相比,霍特林变换具有“数据定制”特性,在理论最优去冗余方面表现突出,但计算复杂度较高。它特别适用于卫星影像、医学图像等对压缩效率和精度要求严苛的场景。

2025-09-24 21:59:47 683

原创 漫谈<爬虫与反爬的斗争>之反爬技术全景综述

在数据成为核心生产要素的数字化时代,反爬技术的本质是平衡 “数据开放共享” 与 “网站安全、运营利益” 的博弈工具—— 其发展伴随爬虫技术迭代而演进,形成覆盖 “技术防御、行为分析、法律合规” 的完整体系,且国内外因应用场景、合规要求不同,呈现 “技术同源但侧重各异” 的特征。本文基于行业实践、司法案例与技术白皮书,从 “发展历程、核心技术体系、法律生态、未来趋势” 四方面,构建严谨可靠的反爬技术认知框架。

2025-09-24 21:06:43 3586

原创 漫谈<无头浏览器技术>:四、重要应用场景

无头浏览器除自动化测试外,在Web资源处理、数据挖掘和流程衔接三大领域衍生出重要应用场景。主要包括:动态网页数据采集(解决SPA内容抓取问题)、SSR与SEO优化(提升单页应用搜索排名)、批量Web任务自动化(替代人工重复操作)、内容合规检测(自动化扫描违规内容)及Web3适配(支持区块链交互测试)。这些场景虽碎片化且生态依赖性强,但在特定垂直领域展现独特价值。其中Web3适配和办公自动化最具发展潜力,而SSR等场景可能因技术替代逐渐萎缩。这些非核心应用有效扩展了无头浏览器的技术边界,成为对主战场的重要补充

2025-09-23 15:09:25 873

原创 漫谈<无头浏览器技术>:三、核心战场

无头浏览器在自动化测试领域占据核心地位,这得益于三大优势:技术适配性(无GUI特性适配DevOps环境、内核级保真还原用户场景、高效并发满足大规模测试)、成熟生态(大厂战略投入、全流程工具链、规模化商业验证)以及可量化的商业价值。相比之下,爬虫、服务端渲染等场景存在需求萎缩、替代性强等局限。未来AI融合将进一步强化自动化测试的主战场地位,形成不可替代的技术闭环。

2025-09-23 14:47:29 974

原创 漫谈<无头浏览器技术>:二、演进之路

无头浏览器从工具到智能基础设施的演进分为四个阶段:2010-2017年的探索期(PhantomJS)、2018-2023年的爆发期(Puppeteer/Playwright)、2023-2024年的博弈期(反爬与AI融合)和2024年后的智能合规期(AI原生工具链与云服务)。未来将向全平台适配、性能优化和AI深度集成发展,应用场景扩展到AIAgent、Web3测试和企业RPA,并通过云服务和低代码工具实现普及。技术演进的核心逻辑是从工具到基础设施,从业者需关注AI集成与云原生能力。

2025-09-23 12:49:08 741

原创 漫谈<无头浏览器技术>:一、概念与应用框架

无头浏览器是一种没有图形界面的网页处理工具,具备完整浏览器功能但更轻量高效。它解决了动态网页处理、无GUI环境适配等核心痛点,广泛应用于数据爬取、自动化测试等场景。主流工具包括Headless Chrome、Playwright等,各有适用场景。使用时需注意反爬伪装、资源控制和环境适配。无头浏览器通过剥离GUI冗余,实现了高效自动化处理,是动态网页操作的重要技术方案。

2025-09-23 11:56:09 1217

原创 浏览器自动化三巨头对决:Playwright、Selenium 与 Pyppeteer 深度对比与选型指南

本文对比了浏览器自动化领域三大工具:Selenium、Pyppeteer和Playwright。Selenium作为老牌工具生态成熟但维护成本高;Pyppeteer轻量但仅支持Chrome生态;Playwright作为新兴工具功能全面,尤其在多浏览器适配和现代网页支持上表现突出。文章从技术架构、开发体验、浏览器支持等8个维度进行了详细对比,指出三者各有适用场景:Selenium适合旧系统维护,Pyppeteer适合轻量级Chrome自动化,而Playwright则是最适合新项目的选择。

2025-09-22 22:31:37 1317

原创 Python 网络爬虫生态全景综述

Python 凭借简洁语法、丰富库及活跃社区,构建了覆盖 “请求 - 解析 - 动态处理 - 反爬 - 存储 - 扩展” 全流程的爬虫生态。生态兼具分层设计与灵活性,适配从新手到企业级需求,正融合 AI 向智能化、合规化演进。

2025-09-22 21:05:55 2482

原创 同源异流:北京、上海、香港三联书店的差异化发展

三家三联书店虽同承 “三联” 品牌基因,却在历史分流与地域赋能中形成了清晰的差异化定位:北京三联以 “国家级学术高地” 立根,上海三联以 “海派区域标杆” 立足,香港三联以 “国际传播枢纽” 立身。三者既无绝对优劣之分,更形成 “学术引领、区域深耕、国际传播” 的互补格局,共同构成中国出版业多元发展的重要生态,延续着 “生活・读书・新知” 的品牌内核。

2025-09-22 13:03:11 1233

原创 漫谈网页自动化与数据采集的发展历程

本文梳理了网页自动化与数据采集技术的四个发展阶段:早期探索阶段(2000年前)主要处理静态网页;工具爆发期(2000-2010年)出现Selenium等动态交互工具;智能化对抗期(2010-2020年)无头浏览器与反爬技术激烈博弈;AI驱动转型期(2020年后)强调合规化与智能系统。发展过程中,技术从简单的HTTP请求演变为AI驱动的复杂系统,反爬机制也从简单IP封锁升级为AI风控,同时法律规范日益完善。未来趋势将聚焦多模态数据采集、联邦学习等技术,在效率与合规间寻求平衡。

2025-09-17 22:51:29 2293

原创 漫谈《数字图像处理》之形状数的原理与计算方法

形状数是解决弗里曼链码旋转依赖性和起点依赖性的关键方法。它通过一阶差分运算消除旋转影响,再通过循环移位选取最小数值序列实现起点不变性,从而为同一形状生成唯一标识。计算过程包括:确定链码方向数(4或8方向)、计算一阶差分序列、生成所有循环移位序列并选取最小值。形状数具有归一化、低冗余的特点,广泛应用于形状匹配、目标识别和图像检索等领域,成为数字图像处理中重要的形状描述工具。

2025-09-13 10:14:02 911

原创 漫谈《数字图像处理》之边缘检测与边界预处理的辨析

摘要:边缘检测与边界预处理是数字图像处理中的两个关键环节,但功能定位不同。边缘检测属于图像分割范畴,通过梯度计算等方法从原始图像中识别边缘像素,解决“边界在哪里”的问题;而边界预处理则针对已检测的边缘进行优化,通过闭合化、去冗余、像素排序等操作,使边缘符合特征提取要求,解决“边界如何用”的问题。两者在时序上前者优先,功能上互补,共同构成完整的图像处理技术链。

2025-09-12 09:28:02 935

原创 漫谈《数字图像处理》之m邻接(混合邻接)概念与应用

m邻接是数字图像处理中解决8邻接“歧义路径”问题的关键方法。它通过“邻接优先+条件性8邻接”的混合规则,在保留合理对角线连通的同时确保路径唯一性。m邻接的核心是当且仅当对角线像素的4邻域交集为空时才允许8邻接连通,从而避免虚假连通。相比4邻接和8邻接,m邻接在细线条处理、骨架提取等需要精准连通性的场景中具有不可替代的优势,能够平衡连通范围与连通精度的矛盾,是数字图像处理中实现高精度连通区域分析的重要工具。

2025-09-11 17:15:24 965

原创 漫谈《数字图像处理》之关于m邻接、8邻接、m通路、8通路的两个概念辨析

摘要:本文探讨了图像处理中关于像素邻接和通路关系的两个争议性问题。首先论证“若p和q是m邻接则必是8邻接”的正确性,指出m邻接是8邻接的子集,是在8邻接基础上增加约束条件。其次分析“若存在8通路则必存在m通路”的合理性,解释m邻接的设计目的是在保持8邻接连通性的同时修正拓扑缺陷。通过定义分析和逻辑推导,作者认为这两个命题都是正确的。(145字)

2025-09-10 17:10:03 1534

原创 实践《数字图像处理》之图像方向性自适应阈值处理

方向性自适应阈值通过引入方向特异性窗口(如水平/垂直矩形)或结合方向特征(如边缘梯度、Gabor滤波),针对具有明显方向结构的图像(如文字、血管、纹理)进行优化。相比传统各向同性方法,它能有效排除无关方向噪声干扰,提升分割精度。实现方式包括固定方向窗口滤波或动态方向匹配,适用于OCR、医学影像和工业检测等场景,虽计算复杂度较高,但显著改善方向敏感目标的二值化效果。核心价值在于使阈值计算与目标方向特征精准适配。

2025-09-09 17:42:01 1794

原创 漫谈《数字图像处理》之图像自适应阈值处理

自适应阈值处理是图像分割中的关键技术,通过为每个像素动态计算局部阈值,有效解决光照不均、阴影等问题。相比全局阈值,它采用邻域窗口(如5×5或11×11)计算局部均值或高斯加权均值,并引入常数C调整阈值偏差,适用于OCR、医学影像等场景。OpenCV中提供均值法(快速)和高斯法(抗噪)两种计算方式,参数选择需权衡窗口大小、噪声和细节保留。实验显示,自适应阈值能清晰分割阴影文字,显著优于全局阈值。该方法的核心是“局部信息解决局部问题”,为复杂光照图像提供可靠分割方案。

2025-09-09 15:40:08 1030

原创 实践《数字图像处理》之Canny边缘检测、霍夫变换与主动二值化处理在短线段清除应用中的实践

本文探讨了图像处理中短线清除的关键技术流程,包括灰度化、Canny边缘检测、霍夫变换直线检测及短线删除。重点分析了Canny边缘检测在霍夫变换前的必要性,指出Canny能过滤无效信息,提供精准边缘,避免霍夫变换的误检问题。同时强调Canny前不应进行二值化处理,因为这会破坏灰度梯度信息,影响边缘检测精度。实验表明,Canny输出的边缘图能显著提升霍夫变换的直线检测效果,减少误检。

2025-09-08 15:04:08 1346 2

原创 漫谈《数字图像处理》之实时美颜技术

实时美颜技术通过分层协作架构实现自然流畅的效果:1)基础定位层通过人脸检测和关键点识别生成精准分区掩码;2)纹理优化层采用滤波组合策略(如导向滤波+细节增强)平衡去瑕疵与保细节;3)形态调整层基于三角网格变形并配合边缘平滑;4)色彩优化层在磨皮后进行针对性校准。全流程采用GPU并行加速,通过区域掩码限制计算范围,确保在移动端实现60fps流畅处理。技术组合遵循目标导向、效率优先原则,避免冗余计算,实现自然美颜与实时性能的平衡。

2025-09-04 21:38:38 1394

原创 漫谈《数字图像处理》之图像清晰化处理

图像清晰化处理技术主要可分为四大类:空间域方法(如对比度增强、空域滤波锐化)、频率域方法(如高通滤波)、模型驱动方法(如去模糊、去雾)和深度学习方法(如CNN网络)。空间域方法直接操作像素,通过对比度调整和边缘增强提升清晰度;频率域方法利用傅里叶变换增强高频分量;模型驱动方法基于物理模型逆向恢复;深度学习方法则通过神经网络学习映射关系。实际应用中常结合多种技术,选择取决于模糊类型和图像特性。

2025-09-03 21:38:21 1033

原创 漫谈《数字图像处理》之基函数与基图像

本文系统阐述了数字图像处理中基函数与基图像的核心概念及其应用发展。基函数作为数学基础单元,通过组合可表示复杂图像信号,而基图像是其二维可视化形式。二者与变换、滤波技术共同构成处理闭环,支撑压缩、去噪、特征提取等任务。技术演进经历了从传统手动设计(如傅里叶、小波基)到数据驱动学习(如字典学习、CNN卷积核)的转变,并迈向FactorFields等前沿统一框架。随着定制化与AI技术的融合,基函数/基图像将在超高清重建、3D渲染等领域持续发挥关键作用,推动图像处理创新发展。

2025-08-31 21:12:44 1021

原创 漫谈《数字图像处理》之分水岭分割

分水岭分割算法是一种基于数学形态学的图像分割方法,将图像灰度值模拟为地形高度,通过“注水”过程将像素划分为不同目标区域。算法核心步骤包括:预处理(去噪增强)、标记起点(内部标记为前景核心,外部标记为背景边界)、计算地形高度(距离变换)、模拟有序注水(优先队列扩散)和生成分水岭边界。该算法能精准分割连通区域,但对噪声敏感且依赖种子点准确性。改进方法包括图像降采样、区域预分割、算法简化和硬件加速等策略,可有效提升计算效率。该算法适用于医学影像、工业检测等目标边界清晰的场景。

2025-08-30 20:43:45 994

原创 漫谈《数字图像处理》之浅析图割分割

本文介绍了图割分割技术的核心原理与应用价值。该技术通过将图像转化为节点-边结构的图模型,利用最小割算法实现目标与背景的精准分离。其优势在于边界精确性、交互可控性和结果稳定性。理论基础源于图论的最小割-最大流定理,通过能量最小化将分割问题转化为数学优化。文章还辨析了图论、图割分割、图数据库和图谱等易混淆概念,阐明它们从理论到应用的逻辑关系。图割分割作为计算机视觉的重要技术,在图像处理领域具有显著实用价值。

2025-08-29 22:46:23 1122

原创 漫谈《数字图像处理》之“降维神器”:超像素

超像素技术是图像处理领域的关键预处理手段,通过将相似像素聚合为超像素块,在保留图像核心结构的同时实现降维简化。文章从五个维度解析该技术:1)核心价值在于平衡计算效率与结构保留;2)主流算法包括SLIC、SEEDS和LSC,分别适用于通用场景、医学影像和纹理处理;3)技术特点体现为效率提升、抗噪能力强,但存在参数依赖和细节限制;4)应用场景涵盖图像分割、目标检测、医学诊断和图像编辑;5)当前发展呈现算法优化、与深度学习融合及产业落地三大趋势。随着技术进步,超像素将在高分辨率图像处理和实时视觉领域展现更大潜力。

2025-08-29 22:13:05 984

原创 漫谈《数字图像处理》之区域生长和区域分离聚合

区域生长与区域分离聚合是两种基于灰度相似性的图像分割技术。区域生长采用"从点到面"的扩张逻辑,依赖种子点和相似性阈值,适合小目标分割但参数敏感;区域分离聚合采用"从面到点再到面"的迭代逻辑,通过拆分-合并过程实现分割,无需种子点且稳定性强,适用于大目标但计算复杂。前者适合特征单一的小目标(如医学结节检测),后者适合特征不均的大目标(如遥感图像分析)。选择方法需考虑目标大小、特征均匀性和场景复杂度。

2025-08-28 20:44:38 1378

原创 漫谈《数字图像处理》之霍夫变换

霍夫变换是图像处理中提取几何特征的核心技术,具有强抗干扰性和明确的参数输出优势。其数学基础融合了解析几何的参数化描述与离散数学的离散化计数逻辑,通过“空间映射-参数投票-极值提取”流程实现几何检测。核心思想是利用图像空间点与参数空间曲线的对偶关系,将共线/共圆等几何特征转化为参数空间的交点统计问题。极坐标参数化解决了直角坐标系的无限性缺陷,使算法具有普适性。该原理可推广至圆、椭圆等形状检测,通过建立对应参数方程实现。霍夫变换通过“点-曲线”对偶关系,将模糊的几何关联转化为可统计的离散问题。

2025-08-27 22:29:47 1130

原创 漫谈《数字图像处理》之霍夫变换发展历程与演进脉络

霍夫变换的发展历程可分为六个阶段:从1959年提出专利构想,到1969年理论奠基,1972年技术突破推广至曲线检测,1981年实现广义化升级。2010年后,霍夫变换与深度学习融合转型为辅助工具,在低算力设备、预处理/后处理、小样本和高可解释性场景中保持优势。该技术从特定解决方案演变为与AI互补的核心工具,未来将在轻量级、可解释性需求中持续发挥作用。

2025-08-26 22:04:25 904

原创 漫谈《数字图像处理》之经典空域边缘检测Canny与LOG

本文对比分析了数字图像处理中两种经典边缘检测算法:Canny和LOG(高斯拉普拉斯)。Canny算法通过高斯滤波降噪、计算梯度、非极大值抑制和双阈值判断等步骤,实现精准、连续的边缘检测,但实现较复杂且依赖人工调参。LOG算法则采用高斯平滑结合拉普拉斯算子计算零交叉点的方式,原理简单但对噪声敏感且边缘定位精度低。两者都基于“灰度突变”原理,共享传统方法的局限性,如人工调参依赖和抗噪声能力不足。实际应用中,Canny更适用于需要高精度边缘的工程场景,而LOG适合教学演示和对弱边缘检测要求不高的场景

2025-08-26 16:50:53 887

原创 漫谈《数字图像处理》之Kirsch罗盘核八个方向

Kirsch罗盘核是一种经典的边缘检测算子,通过8个方向的3×3模板进行卷积运算捕捉图像边缘。其检测步骤包括:准备模板、遍历像素、计算响应值、确定边缘强度与方向、阈值处理及输出结果。优点在于能检测多方向边缘,效果优于简单算子;缺点是计算量大且对噪声敏感。8个方向模板基于暗侧对应命名方向原则设计,通过负权重区与正权重区的互补分布,精准捕捉不同走向的边缘特征。该算法将地理方位与图像边缘的亮暗变化关联,实现全面的边缘检测。

2025-08-25 17:15:46 1358

原创 漫谈《数字图像处理》之平滑

图像平滑的核心目标是降低噪声和模糊细节,通过局部像素调整使图像更平缓。主要方法包括形态学平滑(基于腐蚀和膨胀操作,适合处理椒盐噪声和保留边缘)和基于像素值加权的平滑(如均值、高斯、中值平滑)。尽管实现方式不同,所有平滑方法都遵循“去高频、保低频”的原则,即抑制局部突变而保留整体结构。选择方法需根据噪声类型和结构特征,但本质都是使图像趋于平缓。

2025-08-21 21:13:13 692

原创 漫谈《数字图像处理》之灰度腐蚀和膨胀

灰度腐蚀和膨胀是图像形态学处理的核心技术。腐蚀通过取局部最小值使图像变暗,收缩亮区域;膨胀取局部最大值使图像变亮,扩张亮区域。结构元素可以是平坦(权重均匀)或非平坦(带权重),前者实现全局调整,后者能更精细控制局部效果。二者结合能实现去噪、边缘增强、图像分割等应用,如开闭运算去噪、形态学梯度提取边缘、修复图像细节等,在医学影像、文字识别等领域有重要作用。

2025-08-20 22:11:32 1310

OpenCV的windows源代码安装

OpenCV的windows源代码安装

2025-08-06

OpenCV-Python 模块导入机制与包结构

OpenCV-Python 模块导入机制与包结构

2025-08-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除