文档布局分析工具之DIVA

介绍了一个基于像素级别的文档布局分析评估工具,此工具在ICDAR2017比赛中使用,支持不同预测结果的可视化,如绿色表示前景预测正确,黄色表示预测出了前景但类别错误等。评估指标包括正确匹配率、海明距离、精确率、召回率、准确率、F1值及杰卡德距离。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文:Open Evaluation Tool for Layout Analysis of Document Images 

Github:https://github.com/DIVA-DIA/DIVA_Layout_Analysis_Evaluator

 

IAPR 2017

 

论文提出了一个文档布局分析的基于像素级别的标注化工具。该评测工具已经在ICDAR 2017 文档布局分析大赛中使用。该工具使用java开发,并且官方提供了Restful API。

(a)原图

(b)预测的结果

(c)预测结果图片和原始图片的叠加

 

使用不同的颜色表示不同的预测结果

绿色:前景预测正确

黄色: 预测出了前景,但是前景的类别预测错误

黑色: 背景预测正确

红色: 背景预测为前景

蓝色: 前景预测为背景

 

True Positive (TP) :预测为正,label也为正

True Negative (TN) :预测为负,label也为负

False Positive (FP) :预测为负样本,label为正样本,误检

False Negative (FN) :预测为负,label为真,漏检

主要评判的结果包含,

正确匹配率(exact match)

海明距离(Hamming score)

精确率(Precision)

召回率(Recall)

准确率(Accuracy):

F1值(F1-Score)

杰卡德距离(Jaccard index)

运行:

mvn package
cd target
java -jar LayoutAnalysisEvaluator.jar -gt ../examples/original.png -p ../examples/visualization.png -o ../examples/original.png

结果:

Mean IU (Jaccard index) = 0.00627
EM=0.01 HS=0.38 IU=0.01,0.01[0.01|0.01|0.01|0.01] F1=0.01,0.01[0.01|0.01|0.01|0.01] P=0.75,0.01[1.00|0.65|0.65|0.71] R=0.01,0.01[0.01|0.01|0.01|0.01]Freq:[0.39|0.20|0.20|0.20]
Visualization image written in: ..\examples\visualization.visualization.png
Overlap image written in: ..\examples\visualization.overlap.png

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值