26、古代文献与历史建筑的图像分割技术探索

古代文献与历史建筑的图像分割技术探索

古代希腊纸草文献图像预处理与数据集构建

在处理古代希腊纸草文献图像时,为了进行书写者识别任务,需要一系列的预处理操作。
- 行标注 :使用 LabelImg 工具手动进行行标注,标注时注意不包含图像中没有书写内容的部分。该工具可以创建围绕待选行的矩形(边界框),标注完成后会生成一个 XML 文件,其中包含了边界框的所有详细信息,如每个边界框的起始和结束坐标。
- 图像裁剪 :利用 XML 文件中的信息和 Python 库,可以将每个选定的元素裁剪出来并单独保存。这样,对于每个原始纸草图像,处理结果是一系列图像,每个图像包含单独的一行。
- 预处理 :由于上述过程得到的图像宽度变化很大,设计了两种不同的预处理方法来生成宽度相似的图像。
- 预处理 1 :识别所有可用图像中宽度最小的行图像(在本案例中宽度值为 1232 像素),然后根据这个宽度对其他所有图像进行分割。如果行图像的最后一部分宽度低于该值,则可能会被丢弃。
- 预处理 2 :假设一个预定的宽度阈值(500 像素),对所有行进行裁剪。这样会得到更多的行图像,可能会减少有用书写内容的丢失。

最终构建了用于书写者识别任务的 PapyRow 数据集。该数据集的样本直接来自扩展的 GRK - Papyri 数据集,并经过了一些图像增强操作。由于纸草因时间而严重退化,存在缺失部分、孔洞、不同的对比度和光照条件,所以采用了背景平滑处理。此外,由于图像尺寸差异很大,在保持原始纵横比的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值