这两天测试的时候发现tesseract行为很怪异,版面分析后切分的块大小居然比原始图片还大。难道是我程序出问题了?要是tesseract本身出问题就麻烦了——看那庞大的代码库就只有哭了。反复检查自己的代码,实在找不到错在哪。没办法,只好硬着头皮看看库里面是怎么实现的了。最后,终于发现tesseract-3.00版本的baseapi.cpp文件的一个函数似乎少写了一行代码,添上之后问题就消失了。原来如此,让我纠结了这么久。已经提交了issue,等待google的开发人员回复。
tesseract出bug了
最新推荐文章于 2022-03-16 21:44:40 发布
在使用Tesseract OCR进行版面分析时遇到切分块大小异常的问题,经过深入研究发现是由于3.00版本中baseapi.cpp的一个小bug导致。通过补充一行代码解决了该问题,并已提交issue。
1188

被折叠的 条评论
为什么被折叠?



