38、弱监督边界框提取与地下考古数字化探索

最新推荐文章于 2025-11-02 16:42:23 发布

QuietPulse

最新推荐文章于 2025-11-02 16:42:23 发布

阅读量29

点赞数

CC 4.0 BY-SA版权

分类专栏：解析模式识别与深度学习的前沿进展文章标签：弱监督边界框提取表格检测伪标签技术

本文链接：https://blog.youkuaiyun.com/c2d3e4f/article/details/149544245

解析模式识别与深度学习的前沿进展专栏收录该内容

71 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

弱监督边界框提取与地下考古数字化探索

在文档图像的表格检测以及地下考古遗址研究等领域，面临着诸多挑战，如数据标注不足、地下环境数据采集困难等。下面将分别介绍针对这些问题的解决方案和研究成果。

弱监督边界框提取用于表格检测

在文档图像的表格检测任务中，缺乏全面且具挑战性的数据集，同时训练先进的检测算法（如 Faster - RCNN）需要大量标注数据。为解决这些问题，采用了弱监督边界框提取技术。

弱监督边界框提取原理

未定义的无表格类降低了边界框提取成本，提取的边界框虽不太精确，但对于文本周围的框定相对可接受，因此称该技术为弱监督边界框提取。此过程为训练提供了包含两类图像及其标签和边界框的必要数据集。

伪标签技术训练步骤

在训练的下一阶段，使用伪标签技术（半监督学习方法）将表格和无表格标签与边界框关联起来。伪标签技术主要包括三个步骤：
1. 第一阶段 ：使用上述弱监督边界框提取技术。
2. 第二阶段 ：将表格和非表格图像输入模型进行预测，得到的子集称为“伪标签数据”。
3. 第三阶段 ：将第一阶段的标注数据和第二阶段的伪标签数据合并为一个子集，用于模型训练。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(标注数据: 两类标注图像):::process --> B(训练模

会员秒杀 ¥9.9 重磅福利

超级会员免费看