倾斜矫正:用Python和OpenCV实现图像倾斜校正

102 篇文章 ¥59.90 ¥99.00
本文介绍如何使用Python和OpenCV库解决图像倾斜问题。通过安装OpenCV,导入必要的库,定义校正函数,检测边缘和直线,计算角度并旋转图像,最终实现图像的倾斜校正。示例代码可用于实际操作,根据需求可调整参数。

图像倾斜是在图像获取或扫描过程中常见的问题,它可能会导致图像失真、文字难以识别或其他应用中的问题。在本文中,我们将使用Python编程语言和OpenCV库来实现图像倾斜校正。

首先,我们需要安装OpenCV库。可以使用以下命令在Python环境中安装它:

pip install opencv-python

安装完成后,我们可以开始编写代码。下面是一个实现图像倾斜校正的示例代码:

import cv2
import numpy as np

def correct_skew(image):
    # 转换为灰度图像
    gray = cv2.cvtColor
### 使用Python进行图像倾斜自动校正 为了实现图像倾斜的自动校正,通常会借助于计算机视觉库OpenCV来完成这一过程。该方法主要依赖边缘检测几何变换来计算并修正图像中的旋转角度。 #### 方法概述 首先加载待处理的目标图像,并将其转换为灰度模式以便后续操作更高效[^1]。接着运用高斯模糊减少噪声干扰,再通过Canny算子提取图像轮廓特征。基于这些边界信息,可以进一步分析得到可能存在的矩形区域——即文档的大致范围。对于每一个候选框而言,其四个顶点坐标可用于估算整体偏转程度;而最小二乘法拟合直线则有助于精确定位文字行方向上的倾角大小。最后一步则是构建仿射矩阵执行逆时针旋转变换,使最终输出的结果尽可能接近水平状态。 #### 实现代码示例 下面给出了一段完整的Python脚本用于演示上述流程: ```python import numpy as np import cv2 from skimage.filters import threshold_local def order_points(pts): rect = np.zeros((4, 2), dtype="float32") s = pts.sum(axis=1) rect[0] = pts[np.argmin(s)] rect[2] = pts[np.argmax(s)] diff = np.diff(pts, axis=1) rect[1] = pts[np.argmin(diff)] rect[3] = pts[np.argmax(diff)] return rect def four_point_transform(image, pts): rect = order_points(pts) (tl, tr, br, bl) = rect widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2)) widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2)) maxWidth = max(int(widthA), int(widthB)) heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2)) heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2)) maxHeight = max(int(heightA), int(heightB)) dst = np.array([ [0, 0], [maxWidth - 1, 0], [maxWidth - 1, maxHeight - 1], [0, maxHeight - 1]], dtype="float32") M = cv2.getPerspectiveTransform(rect, dst) warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight)) return warped image = cv2.imread('path_to_image') gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) blurred = cv2.GaussianBlur(gray, (5, 5), 0) edged = cv2.Canny(blurred, 75, 200) cnts = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)[0] if cnts is not None and len(cnts)>0: cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5] for c in cnts: peri = cv2.arcLength(c, True) approx = cv2.approxPolyDP(c, 0.02 * peri, True) if len(approx) == 4: screenCnt = approx break warped = four_point_transform(image, screenCnt.reshape(4, 2)) V = cv2.split(cv2.cvtColor(warped, cv2.COLOR_BGR2HSV))[2] T = threshold_local(V, 29, offset=15, method="gaussian") thresh = (V > T).astype("uint8") * 255 cv2.imwrite('output_path', thresh) ``` 此段程序实现了从读取原始图片到最后保存矫正后的版本整个链条的功能。其中`order_points()`函数负责重新排列四边形顶点顺序以适应透视变化的需求;`four_point_transform()`完成了实际的空间映射工作。此外还包含了基本预处理步骤如颜色空间转换、平滑滤波以及边缘捕捉等环节[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值