38、弱监督边界框提取与地下考古数字化探索

弱监督边界框提取与地下考古数字化探索

在文档图像的表格检测以及地下考古遗址研究等领域,面临着诸多挑战,如数据标注不足、地下环境数据采集困难等。下面将分别介绍针对这些问题的解决方案和研究成果。

弱监督边界框提取用于表格检测

在文档图像的表格检测任务中,缺乏全面且具挑战性的数据集,同时训练先进的检测算法(如 Faster - RCNN)需要大量标注数据。为解决这些问题,采用了弱监督边界框提取技术。

弱监督边界框提取原理

未定义的无表格类降低了边界框提取成本,提取的边界框虽不太精确,但对于文本周围的框定相对可接受,因此称该技术为弱监督边界框提取。此过程为训练提供了包含两类图像及其标签和边界框的必要数据集。

伪标签技术训练步骤

在训练的下一阶段,使用伪标签技术(半监督学习方法)将表格和无表格标签与边界框关联起来。伪标签技术主要包括三个步骤:
1. 第一阶段 :使用上述弱监督边界框提取技术。
2. 第二阶段 :将表格和非表格图像输入模型进行预测,得到的子集称为“伪标签数据”。
3. 第三阶段 :将第一阶段的标注数据和第二阶段的伪标签数据合并为一个子集,用于模型训练。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(标注数据: 两类标注图像):::process --> B(训练模
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值