光学字符识别(HMM维特比算法)

OCR识别与HMM维特比算法

最新推荐文章于 2022-05-15 23:21:49 发布

原创

最新推荐文章于 2022-05-15 23:21:49 发布 · 1.5k 阅读

11 ·

CC 4.0 BY-SA版权

光学字符识别（OCR）使用图像处理技术识别文本，通过HMM（隐马尔科夫模型）的维特比算法提高识别准确性。本文讨论了如何利用统计和概率模型对识别结果进行校正，以找到条件概率最大化的原始句子。

题目3：光学字符识别
光学字符识别是把手写或者印刷的文字扫描成图像格式后，再从图像中识别出文字的过程。由于扫描过程中往往会引入噪声，导致识别错误。如果对识别的句子进行词法分析，然后根据单词在句子起始位置出现的概率对识别后的句子进行校正，即可提高识别的准确率。
首先把图片分割成若干个分割块，然后比对各分割块，并按照类似的单词进行分类。完成分类的算法称为分类器。利用大量示例输入对分类器进行测试，从而得出输入各种单词分割块时能够输出的类型，以及出现各种类型的概率。利用该概率即可得出原文中条件概率最大的句子。
给定以单词为单位进行字符识别后的句子,请编写程序找出可能是原文句子中条件概率最大的句子。
输入：
输入由两部分组成，第一部分是已结束分析的过去资料的统计值，第而部分是通过分类器识别出的句子。
输入第一行为原文中出现的单词的个数m(1<=m<=500)和需要处理的句子个数q(1<=q<=100)。
第二行为在原文中出现的m个单词，以空格隔开。单词以小写英文字母组成，长度小于10个字符。
第三行输入m个实数，表示各单词出现在句子起始位置的概率B[i]。B[i]表示第i个单词出现在起始位置的概率。所有B[i]的总和为1.
之后的m行里输入mm大小的实数矩阵T。在T中，i行j列的数字T[i][j]表示第i个单词后会跟上单词j的概率。各行的总概率为1.
之后的m行里输入mm大小的实数矩阵M。在M中，i行j列的数字M[i][j]表示记录有第i个单词的分割块被识别成第j个单词的概率。各行的总概率为1.
之后的q行里输入1个分类器识别出的句子。每行开头输入单词的总数n（1<=n<=100）,之后输入利用分类器识别出的n个单词。所有单词都是包含在第二行单词集合中的词汇。
输出：
每行输出对给定识别结果出现条件概率最大的句子。若给定的输入中存在好几个概率最大的句子，则任意输出一个。
样例输入：
5 3
I am a boy buy
1.0 0.0 0.0 0.0 0.0

0.1 0.6 0.1 0.1 0.1
0.1 0.1 0.6 0.1 0.1
0.1 0.1 0.1 0.6 0.1
0.2 0.2 0.2 0.2 0.2
0.2 0.2 0.2 0.2 0.2

0.8 0.1 0.0 0.1 0.0
0.1 0.7 0.0 0.2 0.0
0.0 0.1 0.8 0.0 0.1
0.0 0.0 0.0 0.5 0.5
0.0 0.0 0.0 0.5 0.5

4 I am a buy
4 I I a boy
4 I am am boy

样例输出：
I am a boy
I am a boy
I am a boy

m,q=list(map(int,input().split(" ")))
words=input().split(" ")
B=

最低0.47元/天解锁文章