【Python】【验证码识别】python 模拟登陆时,验证码自动识别问题

本文详细介绍如何使用Tesseract-OCR进行文字识别及通过jTessBoxEditor进行样本训练的方法,包括样本文件准备、字符矫正及批处理等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Tesseract-OCR的简单使用与训练


Tesseract-OCR是设什么?

Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;

我们所需软件

Tesseract-OCR 下载地址传送门
jTessBoxEditor 下载地址传送门

Tesseract-OCR软件安装,我们不作介绍,很简单,不会的可以百度下

安装好的截图

这里写图片描述

cmd测试安装是否成功

这里写图片描述


如何提升tesseract识别准确率?

tesseract可以识别验证码不假!可是不够准确,我们想要提高准确率,这时我们讲可以使用 jTessBoxEditor 来训练样本,提升识别的准确性!


我们准备样本文件(注意样本必须是.tif/.fiff格式的)

这里写图片描述

Merge样本文件

【注意】:样本图像文件格式必须为tif\tiff格式,否则在Merge样本文件的过程中会出现 Couldn’t Seek 的错误。

打开jTessBoxEditor,Tools->Merge TIFF,将样本文件全部选上,并将合并文件保存为zhiTong.font.exp0.tif
我这里一直是(我这里虽然是tif格式的图片,依然出现了Couldn’t Seek 错误)

方式二:我们借助TiffToy.exe

TiffToy.exe下载地址传送门

这里写图片描述

生成BOX文件

打开命令行【cmd】并切换至zhiTong.font.exp0.tif所在目录,输入,生成文件名为zhiTong.font.exp0.box

tesseract zhiTong.font.exp0.tif zhiTong.font.exp0 batch.nochop makebox

【语法】:tesseract [lang].[fontname].exp[num].tif [lang].[fontname].exp[num] batch.nochop makebox

lang为语言名称,fontname为字体名称,num为序号;在tesseract中,一定要注意格式。

字符矫正

打开jTessBoxEditor,BOX Editor -> Open,打开zhiTong.font.exp0.tif;
这里写图片描述

修改char对应位置的字符,修改完成后记得  【save】 保存

修改char对应位置的字符

在目标文件下【cmd】执行

echo font 0 0 0 0 0 >font_properties

自动生成 font_properties文件

这里写图片描述

方法二:

直接在目标文件下,新建一个txt,命名为font_properties

在里边写内容:

font 0 0 0 0 0 

#【注意】最后一定txt的文件后缀名去掉,也就是去掉".txt"

批处理文件

在【cmd】下执行批处理程序,一定要在cmd下找到目标文件下运行该命令:

echo Run Tesseract for Training.. 
tesseract.exe zhiTong.font.exp0.tif zhiTong.font.exp0 nobatch box.train 

echo Compute the Character Set.. 
unicharset_extractor.exe zhiTong.font.exp0.box 
mftraining -F font_properties -U unicharset -O zhiTong.unicharset zhiTong.font.exp0.tr 


echo Clustering.. 
cntraining.exe zhiTong.font.exp0.tr 

echo Rename Files.. 
rename normproto zhiTong.normproto 
rename inttemp zhiTong.inttemp 
rename pffmtable zhiTong.pffmtable 
rename shapetable zhiTong.shapetable  

echo Create Tessdata.. 
combine_tessdata.exe zhiTong. 

成功后,生成如下文件:
这里写图片描述

我们将zhiTong.traineddata拷贝到 C:\Program Files (x86)\Tesseract-OCR\tessdata(Tesseract-OCR安装位置 下的tessdata 下)
这里写图片描述

我们在【Python】中调用识别库,识别验证码

这里写图片描述

#一般我们网页识别验证码,是通过对网页验证码保存本地,然后在通过识别库,识别输出的
newImg = Image.open('C:/Users/Administrator/Desktop/pic/11.jpg')
text = pytesseract.image_to_string(newImg,lang='zhiTong')#lang='我们刚才新建的识别库'
print(text)
网页验证码处理:
def auto_img():
    driver.get_screenshot_as_file("D:/test2/智通图片/img.jpg") #对整个网页
    imgelement = driver.find_element_by_xpath('.//*[@id="captcha_image"]')  # 定位验证码
    location = imgelement.location  # 获取验证码x,y轴坐标
    size = imgelement.size  # 获取验证码的长宽
    rangle = (int(location['x'] + 10), int(location['y']), int(location['x'] + size['width'] - 20),
              int(location['y'] + size['height']))  # 写成我们需要截取的位置坐标
    i = Image.open("D:/test2/智通图片/img.jpg")  # 打开截图
    i = i.convert('RGB')
    frame4 = i.crop(rangle)  # 使用Image的crop函数,从截图中再次截取我们需要的区域
    frame4.save('D:/test2/智通图片/new.jpg')
    qq = Image.open('D:/test2/智通图片/new.jpg')
    #我开始对图片,做了二值化处理,可以忽略

    imgry = qq.convert('L')  # 图像加强,二值化
    sharpness = ImageEnhance.Contrast(imgry)  # 对比度增强
    sharp_img = sharpness.enhance(2.0)
    sharp_img.save("D:/test2/智通图片/new1.jpg")
    new2 = Image.open('D:/test2/智通图片/new1.jpg')

    return code

至此,我们就可以实现验证码识别,自动验证登录功能!

Python中编写自动验证码登录程序通常涉及到几个步骤,包括图像识别、输入模拟以及网页自动化。由于这需要特定的技术和库支持,例如OCR(光学字符识别)技术处理验证码、Selenium或者webdriver等用于浏览器操作的工具,这里提供一个基础的示例: 1. 安装必要的库: ```bash pip install opencv-python-headless pillow selenium webdriver_manager requests ``` 2. 使用`webdriver_manager`获取并初始化ChromeDriver(或其他浏览器的WebDriver): ```python from webdriver_manager.chrome import ChromeDriverManager driver = webdriver.Chrome(ChromeDriverManager().install()) ``` 3. 打开网页,并定位到验证码区域: ```python driver.get('https://example.com/login') # 替换为实际登录页面地址 captcha_img = driver.find_element_by_xpath('//img[@class="captcha-image"]') # 验证码元素选择器 ``` 4. 使用OCR识别验证码 (这里以Tesseract为例): ```python import pytesseract import cv2 # 读取验证码图片 image_data = captcha_img.screenshot_as_png image = Image.open(BytesIO(image_data)) text = pytesseract.image_to_string(image) print(f"Detected captcha: {text}") ``` 5. 输入验证码和用户名密码: ```python input_box = driver.find_element_by_name('captcha') # 验证码输入框 password_box = driver.find_element_by_name('password') input_box.send_keys(text) # 输入识别出的验证码 username = 'your_username' password = 'your_password' password_box.send_keys(password) # 提交表单 login_button = driver.find_element_by_css_selector('#login-button') login_button.click() ``` 6. 检查登录结果: ```python if "Login successful" in driver.page_source: print("Login successful") else: print("Failed to login") ``` 请注意,这只是一个基本框架,实际应用中可能需要处理更多复杂情况,如验证码刷新、动态加载、反爬虫机制等。另外,某些网站可能会有严格的反机器人策略,直接自动化操作可能会导致账户被封禁。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值