基于文本检测模型检测文本框对图像进行旋转校正

本文介绍如何通过图像旋转0-90度,利用文本检测模型确定最佳旋转角度。首先,通过文本框数量和宽高比选择θ1,接着统计文本框长边倾斜角得θ2,最终结合θ1和θ2对原始图像进行精确旋转,以提高文本识别准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 分别对图像旋转0度、22.5度、45度、67.5度,90度,并保存这5张图片。
  2. 使用(轻量)文本检测模型对这5张图片进行文本检测。
  3. 然后挑选长文本框最多、宽高比最大的角度,作为大致的旋转角度判断,得到角度θ1∈(0,22.5,45,67.5,90)\theta1 \in (0, 22.5, 45, 67.5, 90)θ1(0,22.5,45,67.5,90)
  4. 使用上一步得到的文本框,统计最大的几个文本框长边倾斜角度得到角度θ2\theta2θ2
  5. 通过θ1\theta1θ1θ2\theta2θ2来对原图进行旋转。

左侧原图,右侧校正后图像,四周使用0填充,校正后图像检测文本框画在上边。
在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张欣-男

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值