基于全卷积网络的文本行提取与拜占庭抄本笔迹分类方法
在当今的文档处理和分析领域,文本行提取和笔迹分类是两个重要的研究方向。文本行提取有助于准确识别文档中的文本内容,而笔迹分类则能为历史文献的作者鉴定提供关键线索。下面将详细介绍基于全卷积网络的文本行提取方法以及拜占庭抄本笔迹分类的相关研究。
基于全卷积网络的文本行提取
ICDAR 2017 行分割评估指标
ICDAR 2017 评估指标基于交并比(IU)。对于每一对可能的真实标签(GT)多边形和预测(P)多边形,IU 得分的计算方式如下:
- (IU = \frac{IP}{UP})
其中,(IP) 表示这对多边形中相交的前景像素数量,(UP) 表示这对多边形前景像素并集中的前景像素数量。选择具有最大 IU 得分的对作为 GT 多边形和 P 多边形的匹配对。然后,在这些匹配对中计算像素 IU 和行 IU。
- 像素 IU 的计算公式为:(Pixel\ IU = \frac{TP}{TP + FP + FN})
其中,(TP) 是所有匹配对中行 TP 的全局总和,(FP) 是所有匹配对中行 FP 的全局总和,(FN) 是所有匹配对中行 FN 的全局总和。
- 行 IU 在行级别进行测量。对于每一个匹配对,行精度和行召回率的计算公式分别为:
- (Line\ precision = \frac{line\ TP}{line\ TP + line\ FP})
- (Line\ recall = \frac{line\ TP}{line\ TP + line\ FN})
行 IU 的计算公式为:(Line\ IU = \frac{CL}{CL + ML +
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



