一个基于OpenCV的Python程序,可以从摄像头捕获图像并识别简单数字。您可以根据需要进行调整,包括调整图像预处理和数字识别逻辑

该Python程序利用OpenCV捕获摄像头图像,通过灰度化、高斯滤波、二值化处理和轮廓检测找到数字区域,然后借助TesseractOCR进行数字识别。用户可以调整图像预处理参数以优化识别效果。

一个基于OpenCV的Python程序,可以从摄像头捕获图像并识别简单数字。您可以根据需要进行调整,包括调整图像预处理和数字识别逻辑

import cv2
import numpy as np
import pytesseract

# 设置Tesseract OCR的参数
custom_config = r'--oem 3 --psm 6 outputbase digits'

# 打开默认摄像头
cap = cv2.VideoCapture(0)

while True:
    # 从视频流中读取一帧
    ret, frame = cap.read()

    # 将图像转换为灰度图像
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 对灰度图像进行高斯滤波,降噪
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)

    # 对图像进行二值化处理
    _, thresh = cv2.threshold(blurred, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    # 查找图像中的轮廓,并选出最大的轮廓
    contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    if contours:
        contour = max(contours, key=cv2.contourArea)

        # 计算外接矩形框,并在原图上标记
        x, y, w, h = cv2.boundingRect(contour)
        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)

        # 提取数字区域
        roi = thresh[y:y + h, x:x + w]

        # 调整数字区域大小,并填充黑色背景
        roi = cv2.resize(roi, (28, 28), interpolation=cv2.INTER_AREA)
        roi = cv2.copyMakeBorder(roi, 4, 4, 4, 4, cv2.BORDER_CONSTANT, value=(0, 0, 0))

        # 执行OCR并获取数字结果
        digits = pytesseract.image_to_string(roi, config=custom_config)

        # 显示图像和数字结果
        cv2.imshow('frame', frame)
        cv2.imshow('roi', roi)
        print(digits)

    # 按下 'q' 键退出循环
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放摄像头
cap.release()

# 关闭所有窗口
cv2.destroyAllWindows()

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值