
图像处理与识别
文章平均质量分 85
byxdaz
十年以上C/VC++开发经验。熟悉网络编程、数据库编程、数字图像处理与识别,熟悉软件工程和项目管理,熟悉linux C/C++开发。
展开
-
傅里叶变换C++实现方式
傅里叶变换(Fourier Transform)是一种将信号从时域转换到频域的数学工具,广泛应用于信号处理、图像处理、通信等领域。在 C++ 中实现傅里叶变换(Fourier Transform),可以使用 FFT(快速傅里叶变换) 算法来提高计算效率。OpenCV 提供了高效的cv::dft()函数来计算离散傅里叶变换(DFT)。原创 2025-03-30 10:05:42 · 428 阅读 · 0 评论 -
小波变换C++实现方式
/ 一维小波分解i < len/2;i++) {k++) {// 周期延拓// 二维小波分解(单层)// 对行处理i++) {// 对列处理j++) {支持多种小波族:Daubechies、Symlets、Coiflets、Biorthogonal等提供离散小波变换(DWT)和连续小波变换(CWT)支持一维、二维和三维信号变换包含小波包变换功能开源且跨平台。原创 2025-03-30 11:42:23 · 876 阅读 · 0 评论 -
RGB彩色空间的不同转换公式
在做图像处理时,我们一般采用的是RGB空间,但是在某些特殊情况下,我们也会用到其他的颜色空间。本文主要介绍一些常见的颜色空间的概念和转换公式。颜色的实质是一种光波。它的存在是因为有三个实体:光线、被观察的对象以及观察者。人眼是把颜色当作由被观察对象吸收或者反射不同波长的光波形成的。例如,当在一个晴朗的日子里,我们看到阳光下的某物体呈现红色时,那是因为该物体吸收了其它波长的光,而把红色波长的光反原创 2005-09-01 13:45:00 · 11749 阅读 · 0 评论 -
OCR(计算机是怎样识字的)
1 计算机是怎样识字的1.1 从国际象棋人机大战说起《教电脑识字:浅谈汉字识别》/昊佑寿 著 www.chinaocr.net OCR制作1997年5月间,国际象棋棋王卡斯帕洛夫同由IBM公司华裔科学家谭崇仁和主设计人许峰雄博士负责研制的“深蓝”计算机进行人机国际象棋比赛。这是棋王与计算机的第二次较量。第一次人机大战时,卡斯帕洛夫以优异的战绩获胜,在当时这是人们意料之中的原创 2005-09-01 14:51:00 · 6308 阅读 · 0 评论 -
OCR(联机手写汉字识别)
2 联机手写汉字识别——笔输入——笔输入2.1 什么是笔输入——从键盘输入说起笔(式)输入也叫做手写输入。它的用途是在一块跟计算机连接的书写板上写字,即时把字符输入计算机。必须指出的是,笔输入的作用不只是输入字符的图形,还要据此对该字符加以识别,并用机内代码来表示,以便于对输入的文字作进一步处理。电子计算机是西方发明的,用键盘来打印拼音文字在西方已有很长的历史,因此采用键盘向计算机输入拼音文字和标原创 2005-09-01 14:57:00 · 14635 阅读 · 0 评论 -
OCR(汉字光符阅读器)
3 汉字光符阅读器——印刷汉字识别3.1 从超市收款机说起“光符阅读器”全称是光学字符阅读器,其英文缩写是OCR (Optical Character Reader,简记为OCR)。它是指将印写在纸上的字符借助光学方法变换为电信号后,用计算机进行自动识别(阅读)的装置。光符阅读器的类型很多,用途也很广,和我们每个人的日常生活与工作都有直接或间接的、千丝万缕的关系。到超市购物,付款时收款员把货物在收原创 2005-09-01 15:01:00 · 8047 阅读 · 2 评论 -
OCR(脱机手写汉字识别与印刷汉字识别)
4 “最后的堡垒”——脱机手写汉字识别4.1 攻克堡垒待创新脱机手写汉字识别的用途是把手写字符用字符阅读器自动输入计算机,常用于信函分拣、银行支票识别和统计报表处理以及手写文稿的自动输入。从工作原理上说,脱机手写汉字识别和印刷汉字识别是一样的。但是由于手写汉字字形变化大,上一章中介绍的各种印刷汉字识别特征和方法不完全适用,目前也还没有一套行之有效的识别方法。这是汉字识别最困难的问题,被认为是模式识原创 2005-09-01 15:05:00 · 27796 阅读 · 9 评论 -
OCR(人工神经网络汉字识别系统)
6 人工神经网络汉字识别系统6.1 电脑能“变成”人脑吗计算机能够识字,也能够识别话音,辨别气味,实现某种通常与人类智能有关的功能。但是严格地说,现代的计算机并没有智能,只不过运算速度很高,能够执行人们事先精心编制的程序,完成规定的任务而已。也就是说,现代计算机的性能还不理想,抗干扰能力还较差,不能很好适应工作环境的变化,不像人脑那样能随机应变,去伪存真,去粗存精,具有高超的分析问题和解决问题的能原创 2005-09-01 15:08:00 · 16363 阅读 · 1 评论 -
非特定人脱机手写汉字识别
陈友斌 丁晓青 吴佑寿 一、汉字识别概述 汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋,并将继续发挥重要的、其它文字形式难以取代的作用。然而,汉字是非字母化、非拼音化的文字,在当今高度信息化的社会里,如何快速高效地将汉字输入计算机,已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我国得到普及应用。围绕这一问题,人们提出了原创 2005-09-01 15:18:00 · 5624 阅读 · 0 评论 -
数字图像处理编程入门
数字图像处理编程入门 一本很不错的图像处理书籍,简明扼要本页为图象处理爱好者交流之用, 未经原书本人同意, 请勿用于商业用途.前言目录第1章 Windows位图和调色板source第2章 图象的几何变换source第3章 图象的平滑(去噪声),锐化source第4章 图象的半影调和抖动技术source第5章 直方图修正和彩色变换source第6章 腐蚀,膨胀,细化算法source第7章 边沿检测与原创 2005-09-01 15:34:00 · 5836 阅读 · 2 评论 -
二维小波分析对图像处理的应用(1)
二维小波分析对图像处理的应用(1) [ 作者:佚名 转贴自:南京大学 更新时间:2004-5-27 文章录入:johnchen] 一:引言 本文从二维小波理论出发,对其在图像处理的应用上进行了一些分析和处理,力图反映出小波分析在图像处理方面有着其独特的特点。本文就以下几点进行阐述:①小波基本概念②图像压缩③图像消噪④图象增强⑤图象平滑处理原创 2005-09-01 15:47:00 · 5938 阅读 · 1 评论 -
二维小波分析对图像处理的应用(2)
二维小波分析对图像处理的应用(2) [ 作者:佚名 转贴自:南京大学 更新时间:2004-5-27 文章录入:johnchen ] 四:图像消噪 图像消噪方法的一般说明对二维图像信号的消噪方法同样适用于一维信号,尤其是对于几何图像更适合。二维模型可以表述为 其中, e 是标准偏差不变得高斯白噪声。二维信号的消噪步骤与一维信号的消噪步骤完全相同,也有三步,只是用二维小波分原创 2005-09-01 15:49:00 · 6244 阅读 · 1 评论 -
霍夫变换(Hough Transform)
霍夫变换是图像处理中从图像中识别几何形状的基本方法之一,应用很广泛,也有很多改进算法。最基本的霍夫变换是从黑白图像中检测直线(线段)。我们先看这样一个问题:设已知一黑白图像上画了一条直线,要求出这条直线所在的位置。我们知道,直线的方程可以用y=k*x+b 来表示,其中k和b是参数,分别是斜率和截距。过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一族直线原创 2005-10-18 11:27:00 · 8378 阅读 · 2 评论 -
BP神经网络基本原理
2.1 BP神经网络基本原理 BP网络模型处理信息的基本原理是:输入信号Xi通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号Yk,网络训练的每个样本包括输入向量X和期望输出量t,网络输出值Y与期望输出值t之间的偏差,通过调整输入节点与隐层节点的联接强度取值Wij和隐层节点与输出节点之间的联接强度Tjk以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的原创 2005-11-22 17:06:00 · 116729 阅读 · 3 评论 -
遗传算法介绍
遗传算法介绍遗传算法是模拟达尔文的自然选择学说和自然界的生物进化过程的一种计算模型。它采用简单的编码技术来表示各种复杂的结构,并通过对一组编码表示进行简单的遗传操作和优胜劣汰的自然选择来指导学习和确定搜索的方向。遗传算法的操作对象是一群二进制串(称为染色体、个体),即种群。这里每一个染色体都对应问题的一个解。从初始种群出发,采用基于适应值比例的选择策略在当前种群中选择个体,使用杂交和变异来产生下一原创 2005-11-22 16:32:00 · 11808 阅读 · 1 评论 -
VC数字图像处理编程讲座之二
VC数字图像处理编程讲座之二前 言 数字图像处理技术与理论是计算机应用的一个重要领域,许多工程应用都涉及到图像处理,一直有一个强烈的愿望,想系统的写一个关于数字图像处理的讲座,由于工作学习很忙,时至今日才得以实现。 "图"是物体透射光或反射原创 2005-11-24 15:28:00 · 8282 阅读 · 1 评论 -
VC数字图像处理编程讲座之一
VC数字图像处理编程讲座之一数字图像处理的起源和应用 cndg数字图像处理方法的研究原创 2005-11-24 16:21:00 · 5029 阅读 · 1 评论 -
浅谈图像压缩算法(转载)
浅谈图像压缩算法 余科亮 本文仅讨论静止图像的压缩基本算法,图像压缩的目的在于以较少的数据来 表示图像以节约存储费用,或者传输时间和费用。 JPEG压缩算法可以用失真的压缩方式来处理图像,但失真的程度却是肉眼所 无法辩认的。这也就是为什么JPEG会有如此满意的压缩比例的原因。 下面主要讨论,JPEG基本压缩法。 一.JPEG压缩过程 JPEG压缩分四个步骤实现: 1.颜色模式转换及采样; 2.DC原创 2005-11-24 16:58:00 · 6646 阅读 · 0 评论 -
VC数字图像处理编程讲座之三
VC数字图像处理编程讲座之三 cndg图像的基本概念1. 采样是指将在空间上连续的图像转换成离散的采样点(即像素)集的操作。由于图像是二维分布的信息,所以采样是在 x轴和y轴两个方向上进行。一般情况下, x轴方向与y轴方向的采样间原创 2005-11-25 13:06:00 · 5007 阅读 · 0 评论 -
数字图像处理词汇表 (转载)
数字图像处理词汇表 Algebraic operation 代数运算 一种图像处理运算,包括两幅图像对应像素的和、差、积、商。Aliasing 走样(混叠) 当图像像素间距和图像细节相比太大时产生的一种人工痕迹。Arc 弧 图的一部分;表示一曲线一段的相连的像素集合。Binary image 二值图像 只有两级灰度的数字图像(通常为0和1,黑和白)Blur 模糊 由于散焦、低通滤波、摄像机运动等引原创 2005-11-25 13:12:00 · 3825 阅读 · 0 评论 -
图像文件格式之PNG(转载)
图像文件格式之PNG1.概述PNG是Portable Network Graphics的缩写,是一种采用无损压缩、轻量级的静态图像文件格式。PNG不仅支持基于调色板的图像格式,也支持灰度图,以及真彩色图像,还有可选的Alpha通道;与GIF(Graphics Interchange Format)文件相比,PNG不受专利权的困扰更是它一大优势。PNG是开放的,是自由的,是免费的,从它诞生之日起就扮原创 2005-11-30 09:36:00 · 3366 阅读 · 0 评论 -
VC数字图像处理编程讲座之六
图像文件格式一般的图像文件结构主要都包含有文件头、文件体和文件尾等三部分文件头: 软件ID、软件版本号、图像分辨率、图像尺寸、图像深度、彩色类型、编码方式、压缩算法 文件体:图像数据、彩色变换表 文件尾:用户名、注释、开发日期、工作时间 以上是一个大概的图像文件结构说明,实际的结构根据不同的格式其中的条目要细得多,结构也复杂得多,各个条目所占空间及条目间的排列顺序也大不相同。目前还没有非常统一的图原创 2005-11-30 11:16:00 · 9239 阅读 · 0 评论 -
CxImage类库的技术资料
CxImage类库是一个优秀的图像操作类库。它可以快捷地存取、显示、转换各种图像。有的读者可能说,有那么多优秀的图形库,如OpenIL,FreeImage,PaintLib等等,它们可谓是功能强大,齐全,没必要用其它的类库。但我要说,这些类库基本上没有免费的,使用这些类库,你要被这样那样的许可协议所束缚。在这点上,CxImage类库是完全免费的。另外,在使用上述类库时,你会遇到重重麻烦。因为它们大原创 2005-11-29 14:27:00 · 3750 阅读 · 0 评论 -
VC数字图像处理编程讲座之四
图像的几何变换我们知道,图像是对三维实际景物的平面投影。为了观测需要,常常需要进行各种不同的几何变换。★注意一点,实际上几何变换不改变像素值,而是改变像素所在的位置。 1.图像的平移图像的平移非常简单,所用到的是中学学过的直角坐标系的平移变换公式: x ‘ = x +dx y’ = y + dy 注:(x,y)为源图像的坐标,(x’,y’)为新图像的坐标,dx对应x的偏移量,dy原创 2005-11-28 14:46:00 · 6965 阅读 · 4 评论 -
VC数字图像处理编程讲座之五
图像压缩编码基础图像编码与压缩,从本质上来说,就是对要处理的图像源数据用一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息的目的。压缩通过编码来实现,或者说编码带来压缩的效果。所以,一般把此项处理称为压缩编码。压缩的理论基础是信息论。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原原创 2005-11-30 09:26:00 · 8047 阅读 · 3 评论 -
遗传算法
生物的进化是一个奇妙的优化过程,它通过选择淘汰,突然变异,基因遗传等规律产生适应环境变化的优良物种。遗传算法是根据生物进化思想而启发得出的一种全局优化算法。遗传算法的概念最早是由Bagley J.D在1967年提出的;而开始遗传算法的理论和方法的系统性研究的是1975年,这一开创性工作是由Michigan大学的J.H.Holland所实行。当时,其主要目的是说明自然和人工系统的自适应过程。遗传算法原创 2005-12-19 11:46:00 · 5863 阅读 · 4 评论 -
碎片图像无缝拼合技术的VC++实现(转载)
[文章信息] 作者: 中国电子科技集团公司第二十二研究所青岛分所郎锐 时间: 2005-05-18 出处: 天极网 责任编辑: 方舟 [文章导读] 本文讲述了在VC++ 6.0下多幅碎片图像无缝拼合技术的实现原理和过程 摘要:本文讲述了在Microsoft Visual C++ 6.0下多幅碎片图像无缝拼合技术的实现原理和过程,并给出了部分关键代码以供参考。关键字:Microsoft Vi原创 2005-12-27 10:25:00 · 2413 阅读 · 1 评论 -
图像处理网络资源
作图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。 做好这几点的途径之一就是充分利用网络资源,特别是权威网站和大拿们的个人主页。下面是我收集的一些原创 2005-12-21 18:58:00 · 3557 阅读 · 2 评论 -
指纹识别技术综述(扫盲篇)(转载)
指纹识别技术综述(扫盲篇) 1、产品构成 对指纹识别技术,目前除了一部分真正的研发人员之外,大部分涉业者或者兴趣者都希望有个清晰的了解。在此,先从指纹识别产品的构成说起,也就是由产品构成再展开对技术构成的分析。指纹识别产品是由基础构件、中间构件和上层构件组成的,基础构件是指一个完整的指纹识别(不是指纹采集)产品,包括硬件和软件,都必须具备的基础部分。中间构件,简称中间件,是向上转载 2005-12-28 08:43:00 · 7397 阅读 · 3 评论 -
VC数字图像处理编程讲座之八(2)
图像增强9.2 空间域滤波空间域滤波是一种邻域处理方法,它运算较简便。边缘增强平滑滤波定向滤波中值滤波9.2.1 边缘增强 遥感数字图像中地物的边缘包括地物的边界、地质线性构造和环状构造等,在对图像进行解译和识别时,常需要突出目标的轮廓或边缘信息,这可以通过图像边缘增强(图像锐化)处理来实现。边缘增强主要通过微分而使图像边缘突出、清晰。常用的方法有梯度算子和拉普拉斯算子。 遥感数字图像中地原创 2005-12-28 18:24:00 · 3861 阅读 · 0 评论 -
VC数字图像处理编程讲座之七
图像分割图像分割是指通过某种方法,使得画面场景中的目标物被分为不同的类别。通常图像分割的实现方法是,将图像分为“黑”、“白”两类,这两类分别代表了两个不同的对象。因为结果图像为二值图像,所以通常又称图像分割为图像的二值化处理。7.1二值图像法图像分割原理上的计算公式如下:其中,f(i,j)为原始图像,g(i,j)为结果图像(二值),Th为阈值。7.2 p-参数法•p-参数法对于实现已知目标物在画面原创 2005-12-28 19:19:00 · 4280 阅读 · 0 评论 -
VC数字图像处理编程讲座之九
VC数字图像处理编程讲座之九……特征提取 cndg1、二值图像的边缘特征提取 二值图像的边缘特征提取是GIS图像处理中常用的技术,例如可以用于对地图扫描数字化后的数据进行面状要素的提取。二值图像边缘特征提取的过程实际上是寻找像素灰度值急剧原创 2005-12-30 11:05:00 · 5120 阅读 · 4 评论 -
VC数字图像处理编程讲座之八(1)
图像增强图像增强是数字图像处理的最基本的方法之一,在数字图像处理中受到广泛重视,是具有重要实用价值的技术。图像增强的目的在于:(1)采用一系列技术改善图像的视觉效果,提高图像的清晰度;(2)将图像转换成一种更适合于人或机器进行解译和分析处理的形式。图像增强不是以图像保真度为原则,而是通过处理设法有选择地突出便于人或机器分析某些感兴趣的信息,抑制一些无用的信息,以提高图像的使用价值,即图像增强处理只原创 2005-12-28 18:19:00 · 4854 阅读 · 0 评论 -
支票容错识别系统预处理的设计与实现(转载)
支票容错识别系统预处理的设计与实现*赵 斌 马赓坚 夏绍玮 摘要 文章在支票容错识别系统的基础上,介绍了预处理算法的设计与实现,包括软件定位、各单元子图的提取与背景去除、倾斜校正处理、方格去除和字符串分割等.其中的重点是软件定位和倾斜校正两个预处理算法. 关键词 预处理,模式识别,表格处理,文档分析. 中图法分类号 TP391 Design and Implementation of Pre原创 2005-12-29 19:34:00 · 4457 阅读 · 0 评论 -
名片自动录入系统的实现(转载)
名片自动录入系统的实现林晓帆 丁晓青 吴佑寿 (清华大学电子工程系图象教研组 北京,100084) 摘要 本文介绍了一个名片自动录入系统,它能利用名片版面的位置信息和名片知识分析名片版面属性,然后对分割的各区域进行字符识别,并对识别结果做基于名片知识和词语的后处理,最后从识别结果中提取有用信息录入到数据库的相应字段,完成名片数据库的自动录入。文中着重介绍基于模板匹配的版面分原创 2005-12-29 19:37:00 · 6711 阅读 · 1 评论 -
OCR识别技术在银行单证综合处理系统中的应用
OCR识别技术在银行单证综合处理系统中的应用帐务处理为银行的资金运用提供了科学而有效的管理,而帐务过程的严密性和安全性又体现在凭证的流转上。 原始记账凭证经临柜有关部门封包后送事后监督部门,事后监督先对凭证进行有效性审核,审核有不符合要求的凭证登记差错,将通过的凭证录入事后监督系统作为事后的流水与临柜流水进行逐笔核对,然后根据事后的流水记载事后分户帐,科目发生额,总账,将事后的帐与临柜的帐进原创 2005-12-29 19:41:00 · 5998 阅读 · 1 评论 -
OCR 基本知识
了解OCR OCR是英文Optical Character Recognition 的缩写,中文意思就是通过光学技术对文字进行识别。OCR概念的产生是在1929年,德国的科学家Tausheck首先提出了OCR的概念,并且申请了专利。几年后,美国科学家Handel也提出了利用技术对文字进行识别的想法。但这种梦想直到计算机的诞生才变成了现实。现在这一技术已经由计算机来实现,OCR的意思就演变成原创 2005-12-29 19:47:00 · 6351 阅读 · 0 评论 -
灰关联分析与语音/音乐信号识别
灰关联分析与语音/音乐信号识别来源:电子技术应用 作者:陈 功 张雄伟 摘要:将灰关联分析方法应用于语音/音乐信号的分类和识别,并给出了对音频信号进行灰关联分析的方法和步骤。利用语音和音乐信号的短时能量均方根的概率统计特征建立目标的参考数据和比较数转载 2006-03-16 13:07:00 · 3583 阅读 · 0 评论 -
语音识别系统中增加图像识别技术的设计
语音识别系统中增加图像识别技术的设计来源:电子技术应用 作者:重庆大学通信工程学院 叶凌峡摘要:采用机器视觉对语音对象进行跟踪,利用说话人正常发音时,嘴部的开合状况提取语速信息,实时调整语音识别的工作速度,匹配语音韵律,将有效提高语音识别准确性。讨论了系统的设计原理和实现技术,着重介绍了对应辅助图像识别的设计分析。关键词:语音识别 机器视觉 图像识别语音识别是机器自动语音识别(a转载 2006-03-16 13:10:00 · 4914 阅读 · 1 评论 -
模式识别综述
模式识别综述模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。1统计模式识别的原理与方法简介法1.1 模式识别 什么是模式和模式识别?广义地说,存在于时间和空间中可观察的事物,如果原创 2006-03-10 13:55:00 · 9331 阅读 · 2 评论