在《文档数字化采集与智能处理:图像弯曲矫正技术概述》一文中,我们介绍了文档图像矫正技术的发展沿革与代表性方案。随着文档智能处理的需求逐步升级,文档图像去畸变技术也在不断探索新的可能性。
今天,我们将讨论近年来文档图像矫正任务的前沿进展,分享一些我们正在关注的方向,欢迎与我们共同探讨、交流进步。
Transformer 架构下的文档矫正探索
代表性工作
DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction [1]
-
研究结果
-
提出了一种新的框架 DocTr,用于解决文档图像的几何和照明失真问题。该框架包括一个几何矫正 Transformer 和一个照明矫正 Transformer,通过设置一组学习的查询嵌入,几何矫正 Transformer 捕获文档图像的全局上下文,并解码像素级位移解决方案以纠正几何失真。在几何矫正后,照明矫正 Transformer 进一步去除阴影伪影,提高视觉质量和 OCR 准确性。
-
-
创新优势
-
首次尝试将Transformer架构应用于文档图像矫正领域&#
-