常用的图片处理方法,截取图片指定的大小,ocr等

本文介绍了如何使用Selenium库进行网页截图,并结合PIL库进行裁剪,同时展示了如何利用pytesseract进行中文OCR识别,以提取图片上的文本,适用于爬虫和UI自动化场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用于爬虫,或者ui自动化的相关工具

def get_target_pic(xmin:int ,ymin:int, xmax:int ,ymax:int,img_path:str,new_img_path:str,driver:object):
    '''
    当前函数用于使用selenium截图页面,进行截图使用
    :param xmin: 裁剪位置
    :param ymin: 裁剪位置
    :param xmax: 裁剪位置
    :param ymax: 裁剪位置
    :param img_path: 存储截图的路径
    :param new_img_path: 裁剪的图片的路径
    :return: 返回截取的图片所在的路径
    '''

    from PIL import Image

    driver.get_screenshot_as_file(img_path)

    im = Image.open(img_path)  # 用PIL打开一个图片
    box = (xmin, ymin, xmax, ymax)  # box代表需要剪切图片的位置格式为:xmin ymin xmax ymax
    ng = im.crop(box)  # 对im进行裁剪 保存为ng(这里im保持不变)
    ng.save(new_img_path)
    return new_img_path


def pic_img(pic_path:str):
    '''
    获取图片上的中文
    :param pic_path: 图片路径
    :return: 返回图片上的文字
    '''
    from PIL import Image
    import pytesseract

    # 读取图片
    image_obj = Image.open(pic_path)

    text = pytesseract.image_to_string(image_obj, lang='chi_sim')
    return text

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值