古代文献中规则模式的同步检测与退化去除的深度学习框架
在计算机视觉领域,处理历史文献是一项复杂的任务,因为文献存在退化问题,这会降低机器学习模型的性能。近年来,深度学习模型在处理历史文献方面取得了显著成就,但由于历史文献数据集规模小,这些模型难以捕捉退化特征,性能仍有待提高。本文将介绍一种用于古代文献处理的深度学习框架,包括规则模式检测和退化去除两个方面。
相关研究背景
在文献分析领域存在多种方法,不过许多方法需要有标签的数据以及预训练步骤。在无监督学习方面,深度信念网络(DBNs)尝试从训练分布中学习以获取共同特征,但这类模型在测量潜在似然变量时存在局限性。此外,还有利用训练数据的各种旋转来区分正确标签的新方法。
提出的方法概述
本文提出的框架基于无监督学习与深度卷积生成对抗网络(DCGAN)模型相结合。该方法旨在从不同风格(如页面、装饰和字符)中高效提取特征,以无监督的方式处理大量数据。其核心是通过对抗过程来识别重建文献中的不同特征,学习到的特征将用于后续的分割步骤,以提高分类性能。
工作方法
- 深度学习框架 :GAN的原始架构包含生成器G和判别器D。生成器G试图通过随机噪声向量z在原始图像的潜在空间中生成假图像,而判别器D则评估输出D(G(z))和生成图像G(z),判断其是来自真实图像分布pdata(x)还是假图像分布p(z)。训练目标由两个过程组成:首先,判别器通过最大化期望对数似然来更新参数;然后,在判别器参数更新的同时,生成器生成假图像。训练目标函数如下:
[
\min_{G} \max_{D} V(G, D) = E_{x \si
古代文献处理的深度学习框架
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



