文档图像矫正任务的前沿进展:引入Transformer、自监督框架的思路

《文档数字化采集与智能处理:图像弯曲矫正技术概述》一文中,我们介绍了文档图像矫正技术的发展沿革与代表性方案。随着文档智能处理的需求逐步升级,文档图像去畸变技术也在不断探索新的可能性。

今天,我们将讨论近年来文档图像矫正任务的前沿进展,分享一些我们正在关注的方向,欢迎与我们共同探讨、交流进步。

Transformer 架构下的文档矫正探索

代表性工作

DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction [1]

  • 研究结果

    • 提出了一种新的框架 DocTr,用于解决文档图像的几何和照明失真问题。该框架包括一个几何矫正 Transformer 和一个照明矫正 Transformer,通过设置一组学习的查询嵌入,几何矫正 Transformer 捕获文档图像的全局上下文,并解码像素级位移解决方案以纠正几何失真。在几何矫正后,照明矫正 Transformer 进一步去除阴影伪影,提高视觉质量和 OCR 准确性。

  • 创新优势

    • 首次尝试将Transformer架构应用于文档图像矫正领域&#

评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值