基于无监督深度学习的两阶段历史文档处理框架
在历史文档处理领域,由于文档的年代久远,常常存在褪色、污渍、墨水渗透等问题,导致文档图像质量下降,这给文档的分析和识别带来了很大的挑战。为了解决这些问题,研究人员提出了一种两阶段无监督深度学习框架,旨在生成高质量的历史文档图像并进行二值化处理。
1. 相关工作
在历史文档生成方面,已经有多种方法被提出。例如,有深度学习算法用于生成人工数据集,生成对抗网络(GAN)也被用于合成文档图像。然而,这些方法存在一些问题。
- GAN - CLS :该方法由两个神经网络组成,生成器G生成假图像,判别器D区分G的输出和真实图像。但它存在训练数据不足的问题,需要大量的图像及其文本描述。
- Style - GAN :用于合成字母并预测缺失的字母,但输入需要标签,这是一个耗时且复杂的任务。
此外,逆问题在图像恢复中已经研究了数十年,其成功很大程度上取决于设计一个优秀的先验项来揭示退化图像。在深度学习中,先验通常是通过在大量数据集上训练卷积网络来学习的,但大多数方法的性能受限于可用的数据集。
2. 工作方法
该框架主要分为两个阶段:数据增强和文档二值化。
2.1 阶段一:数据增强框架
采用深度卷积生成对抗网络(DC - GAN)进行数据增强。DC - GAN的基本思想与原始GAN类似,但专注于深度全连接网络。
- 原理 :通过对抗游戏解决泛化任务,生成器从随机噪声
超级会员免费看
订阅专栏 解锁全文
1441

被折叠的 条评论
为什么被折叠?



