弱监督边界框提取与地下考古数字化探索
在文档图像的表格检测以及地下考古遗址研究等领域,面临着诸多挑战,如数据标注不足、地下环境数据采集困难等。下面将分别介绍针对这些问题的解决方案和研究成果。
弱监督边界框提取用于表格检测
在文档图像的表格检测任务中,缺乏全面且具挑战性的数据集,同时训练先进的检测算法(如 Faster - RCNN)需要大量标注数据。为解决这些问题,采用了弱监督边界框提取技术。
弱监督边界框提取原理
未定义的无表格类降低了边界框提取成本,提取的边界框虽不太精确,但对于文本周围的框定相对可接受,因此称该技术为弱监督边界框提取。此过程为训练提供了包含两类图像及其标签和边界框的必要数据集。
伪标签技术训练步骤
在训练的下一阶段,使用伪标签技术(半监督学习方法)将表格和无表格标签与边界框关联起来。伪标签技术主要包括三个步骤:
1. 第一阶段 :使用上述弱监督边界框提取技术。
2. 第二阶段 :将表格和非表格图像输入模型进行预测,得到的子集称为“伪标签数据”。
3. 第三阶段 :将第一阶段的标注数据和第二阶段的伪标签数据合并为一个子集,用于模型训练。
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(标注数据: 两类标注图像):::process --> B(训练模