【印刷数字识别】OCR识别系统【含Matlab源码 438期】

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab武动乾坤博客之家💞💞💞💞💞💞💞💞💞💥💥💥💥💥💥💥💥
🚀🚀🚀🚀🚀🚀🚀🚀🚀🚀🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚤🚀🚀🚀🚀🚀🚀🚀🚀🚀🚀
在这里插入图片描述
🔊博主简介:985研究生,Matlab领域科研开发者;

🚅座右铭:行百里者,半于九十。

🏆代码获取方式:
优快云 Matlab武动乾坤—代码获取方式

更多Matlab图像处理仿真内容点击👇
Matlab图像处理(进阶版)

⛳️关注优快云 Matlab武动乾坤,更多资源等你来!!

⛄一、OCR简介

1 什么是OCR技术?
OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。

2 OCR技术的分类:
2.1 按主题划分:手写体识别和印刷体识别。

(1)印刷体大多都是规则的字体,技术上的难点是,在印刷过程中字体很可能变得断裂或者墨水粘连,使得OCR识别异常困难。当然这些都可以通过一些图像处理的技术帮他尽可能的还原,进而提高识别率。总的来说,单纯的印刷体识别在业界已经能做到很不错了,但说100%识别是肯定不可能的,但是说识别得不错那是没毛病。

(2)手写体识别一直是OCR界一直想攻克的难关,但是时至今天,识别难度还是很大。为什么手写体识别这么难识别?因为人类手写的字往往带有个人特色,每个人写字的风格基本不一样,虽然人类可以读懂你写的文字,但是机器缺很难。印刷体一般都比较规则,字体都基本就那几十种,机器学习这几十种字体并不是一件难事,但是手写体,每个人都有一种字体的话,那机器该学习多少字体啊?这就是难度所在。

在这里插入图片描述
2.2 按识别的内容来分类
对于我们国人来说主要分成三类:汉字、英文字母、阿拉伯数字。识别数字是最简单了,毕竟要识别的字符只有0~9,而英文字母识别要识别的字符有26个(如果算上大小写的话那就52个),而中文识别,要识别的字符高达数千个因为汉字的字形各不相同,结构非常复杂(比如带偏旁的汉字)如果要将这些字符都比较准确地识别出来,是一件相当具有挑战性的事情。但是,并不是所有应用都需要识别如此庞大的汉字集,比如车牌识别,我们的识别目标仅仅是数十个中国各省和直辖市的简称,难度就大大减少了。当然,在一些文档自动识别的应用是需要识别整个汉字集的,所以要保证识别的整体的识别还是很困难的。

2.3 OCR流程
在这里插入图片描述
判断页面上的文本朝向,因为我们得到的这页文档往往都不是很完美的,很可能带有倾斜或者污渍,那么我们要做的第一件事就是进行图像预处理,做角度矫正和去噪。
对文档版面进行分析,进每一行进行行分割,把每一行的文字切割下来,最后再对每一行文本进行列分割,切割出每个字符,将该字符送入训练好的OCR识别模型进行字符识别,得到结果。
对其进行识别结果的矫正和优化,比如我们可以设计一个语法检测器,去检测字符的组合逻辑是否合理。比如,考虑单词Because,我们设计的识别模型把它识别为8ecause,那么我们就可以用语法检测器去纠正这种拼写错误,并用B代替8并完成识别矫正。这样子,

整个OCR流程就走完了。从大的模块总结而言,一套OCR流程可以分为:
版面分析 -> 预处理-> 行列切割 -> 字符识别 -> 后处理识别矫正
从上面的流程图可以看出,要做字符识别并不是单纯一个OCR模块就能实现的(如果单纯的OCR模块,识别率相当低),都要各个模块的组合来保证较高的识别率。

⛄二、部分源代码

clc
clear all
close all
Symbols =[‘0’ ‘1’ ‘2’ ‘3’ ‘4’ ‘5’ ‘6’ ‘7’ ‘8’ ‘9’ ‘-’];
P3 = [];
Result = [];
path = ‘C:\Users\lenovo\Desktop\23149049ocr’; % working Path
ext = ‘_bold.bmp’; %Train Data Files Extension name
P = zeros(16,12,11);

% Read 0-9 digits data
for i = 0: 9
file = [path,char(48 + i) , ext]; % char(48) => ‘0’

P(:,:,i + 1) = imread(file);
P3 = [P3,P(:,:,i + 1)'];

end
% imshow(P(:,:,1));

i = i + 1;
% read other symbols
file = [path,‘dash’ , ext];

P(:,:,i + 1) = imread(file);
P3 = [P3,P(:,:,i + 1)'];

% figure
% for i = 1:11
% subplot( 11, 1, i );
% imshow( P(:,:,i) );
% end

P1 = reshape(P3, 12 * 16, 11);

T = zeros(11,11);
for i = 1:11
T(i,i) = 1;
end

[R,Q] = size(P1);
[S2,Q] = size(T);

S1 = 25;

net = newff(minmax(P1),[S1 S1 S2],{‘logsig’ ‘logsig’,‘logsig’},‘traingdx’);

net.performFcn = ‘sse’;
net.trainParam.goal = 0.05;
net.trainParam.show = 100;
net.trainParam.epochs = 5000;
net.trainParam.mc = 0.95;

[net,tr] = train(net,P1,T);

sept2 = []; %character segment start-end pos
Test1 =[];
file = [path,‘test_bold2.bmp’];
a = imread(file);
figure;
subplot(3,24,1:24);
imshow(a);

j =1;
seg1 = a;
b = sum(seg1) ; % character segment, if the vertical projection is zero, means the space between characters.
b(find(b < 1) ) = 0;
c = find(b == 0);
d= find(b > 0);
e = find(c > d(1));
sept2 = [];
for k = 1:size(e,2) -1 % delete repeated zero position
if( c(e(k + 1)) - c(e(k)) > 1)
sept2 = [sept2, c(e( k ))];
sept2 = [sept2, c(e(k + 1))];
end
end

%figure
sept2 = [1, sept2];
chCount = size(sept2);

for k = 1: chCount(2) -1
Test1 = [];
tmp = zeros(16,1);
z = a(:,sept2(k)+1: sept2( k+1 ));
t1 = size(z);
if(t1(2)> 2)
tt1 = size(z);
% if( tt1(2) < 11)
% z = [z,tmp];
% end
tt1 = size(z);
% if( tt1(2) < 11)
% z = [tmp,z,tmp];
% end
z2 = imresize(z,[16,12],‘bilinear’);
% z2 = ~z2;
% z2 = ~z2;
% z2 = double(z2);
% z2 = imnoise(z2,‘salt & pepper’, 0.4);
z2 = ~z2;
z2 = ~z2;
subplot(3,24,24+k);
imshow(z2);
z2 =z2’;

    z3 = reshape(z2,16 * 12,1);
    Test1 = [Test1,z3];
    %figure;
    %imshow(z2);
    %title('TRUE');

% end

⛄三、运行结果

在这里插入图片描述

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1] 蔡利梅.MATLAB图像处理——理论、算法与实例分析[M].清华大学出版社,2020.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

🍅 仿真咨询
1 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化

2 机器学习和深度学习方面
卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM、XGBOOST、TCN实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

3 图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

4 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划、天线线性阵列分布优化、车间布局优化

5 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配

6 无线传感器定位及布局方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化

7 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化

8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置

9 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长

10 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值