
OCR
ocr相关
Mr.RottenPeach
所谓无底深渊,下去,也是前程万里、
展开
-
简记DBNet
《简记DBNet》 文本检测常用的模型,如果要检测多个类别,多加 DBHead 是一种方式,而且dbnet 的一个弊端就是有重叠的文本框目标无法区分。Key Words:dbnet Beijing, 2022DBNet 网络结构backbone: Resnet18neck:FPNhead:DBHeadfm 经过各种卷积上采样4倍得到 prob_mask 利用 bce loss训练fm 经过另外各种卷积上采样4倍得到 threshold_mask 利用 L1 训练sig.原创 2022-05-02 19:51:08 · 604 阅读 · 0 评论 -
ICDAR2013&2015数据解析
《ICDAR2013&2015数据解析》 文档分析与识别国际会议(International Conference on Document Analysis and Recognition,ICDAR)ICDAR数据集是OCR流程常用的benchmark,包含文字目标检测的标注及OCR识别的标注结果,2013和2015的区别是2013给出的目标检测gt是水平框,而2015给出的是四边形(8个值)对歪斜的文本更为有效。本文给出解析数据的脚本,包括将目标框画到原图的功能和切出子图的功能。K.原创 2022-04-30 20:11:01 · 2759 阅读 · 2 评论