
OCR
hzhj
写作不只为了传播,更重要的是思考和学习。
展开
-
icdar evaluaion
预测框与GT之间的匹配关系有五种情况,其中第一个位置表示GT框,第二个位置表示预测框。 无匹配; 一对一的匹配; 一对多的匹配; 多对一的匹配; 多对多的匹配; 图片来自这里 DetEval-Evaluation software for object detection algorithms为评测工具,评测匹配中的一对一、一对多和多对一三种匹配关系。预测结果形式如下,其中icdar2003所在的tag为旧的一对一的评测结果,score为DetEval方式的评测结果。 <evalua原创 2020-05-17 22:58:14 · 334 阅读 · 0 评论 -
EAST
数据并行。使用多gpu进行训练,将batch的训练数据根据设定的gpu数量进行划分,每个gpu训练batch数据中的一部分,得到其结构风险,然后计算当前结构风险的梯度信息。当前batch数据的梯度全部计算完后,进行梯度更新。 for i, gpu_id in enumerate(gpus): #数据并行 with tf.device('/gpu:%d' % gpu_id): with tf.name_scope('model_%d' % gpu_id) a原创 2020-05-16 21:00:37 · 358 阅读 · 0 评论 -
Ocr 数据集
ICDAR(International Conference on Document Analysis and Recognition)专注文字和字符识别的会议,包含自然场景下的中英文检测和识别标注信息,下载数据时需要注册。 It is about character and symbol recognition, printed/handwritten text recognition, graphics analysis and recognition, document analysis, docu原创 2020-05-13 20:34:11 · 592 阅读 · 0 评论 -
CTPN理解
CTPN pipline 类似于faster rcnn的二阶段检测算法,通过anchor作为中间元素进行回归;不同之处是增加了LSTM单元; anchor 固定宽度为16个像素,高度设定为10个值; ctpn中的anchor 图片来自这里 IOU的计算,由于anchor指定宽度16,所以对GoundTruth的坐标也进行变换,得到宽度为16的GT。和faster rcnn一样计算anchor与GT的IOU; RPN为LSTM输出序列经fc后得到部分; CTPN中的RPN,图片来自这里 pro.原创 2020-05-10 22:39:40 · 453 阅读 · 0 评论 -
利用ctc训练字符识别
一、获取字体 win10字体查找方法[Windows + E] ->%WINDIR%/Fonts CentOS Linux字体路径:/usr/share/fonts root@9080e45b4485:~# apt-get install fontconfig root@9080e45b4485:~# fc-list /usr/share/fonts/truetype/de...原创 2020-01-11 19:09:26 · 492 阅读 · 0 评论 -
lpr相关项目介绍
openalpr 相关文件的功能参看wiki,使用文档; 测试例子中的图时,应修改country为eu,即输出结果和国家的配置项相关; 暂时没有中国车牌的模型; C++版本支持单字符分割; binding中的python版本没找到检测和识别的独立模块; 官方基于ubuntu:18.04做的镜像可以根据说明文档运行,但是如果进去容器后(修改Dockerfile最后的ENTRYPOINT为...原创 2018-08-14 11:02:57 · 615 阅读 · 0 评论