一、扫描文档的步骤
- 捕获图像
- 检测边缘
- 提取所需对象/定义轮廓
- 对提取的对象进行透视变换
- 提取文本内容(此处不做处理)
1、scanner.py
import cv2
import numpy as np
import rect
#读入要检测的图片,此处读入单张图片。如果分辨率足够好的话,我们也可以使用笔记本电脑的摄像头。
image = cv2.imread('test.jpg')
#重新设置图片的大小,以便对其进行处理:选择最佳维度,以便重要内容不会丢失
image = cv2.resize(image, (1500,880))
#创建原始图像的副本
orig = image.copy()
#对图像进行灰度处理,并进而进行行高斯模糊处理
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
#使用canny算法进行边缘检测
edged = cv2.Canny(blurred,0,50)
#创建canny算法处理后的副本
orig_edged = edged.copy()
#找到边缘图像中的轮廓,只保留最大的,并初始化屏幕轮廓
#findContours()函数用于从二值图像中查找轮廓
img, contours, hierarchy = cv2.findContours(edged, cv2.RETR_LIST, cv2.CHAIN_APPROX_NONE)
#使用python中的sorted函数返回contours重新排序的结果(降序),排序规则(key):根据计算的轮廓面积大小
contours = sorted(contours, key = cv2.contourArea, reverse = True)
#得到近似轮廓
for c in contours:
p = cv2.arcLength(c, True) #计算封闭轮廓的周长或者曲线的长度
approx =