基于python的使用验证码识别技术(py3 可用)

本文介绍如何利用Python的图像处理库PIL对验证码进行自动化识别,包括图像预处理、分割、特征提取和过滤过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以下技术配合python特有的web 相关处理能力可以再很多方面实施自动化功能了。


from PIL import Image

image_name=r'c:\no2.jpg' #现实中可以直接用urllib.request.urlopen()或者urllib.request.urlretrieve()函数等方式获得。

#以下内容需要实际图片分析得出

sx=20 #起始x
sy=16 #起始y
ex=8 #宽
ey=10 #高
st=20 #步长

def gc(a):#过滤函数,根据实际情况定义过滤
          if a>180:
                    return 0;
          else:
                    return 1;
          
def disp(im): #Image对象解码函数
          sizex,sizey=im.size
          tz=[]
          for y in range(sizey):
                    t=[]
                    for x in range(sizex):
                              t.append(gc(im.getpixel((x,y))))
                    tz.append(t)

          for i in tz:
                    print('')
                    for l in i:
                              print(l,sep='',end='')
          return tz



im = Image.open(image_name) #打开图像,im为该图片对象,支持直接打开文件(例如open)对象。

im = im.convert('L')#转换为灰阶,方便更细的过滤,参考过量函数

#分割图片
im_new = []  
for i in range(5): #验证码切割  
    im1 = im.crop((sx+(i*st),sy,sx+ex+(i*st),sy+ey))  #根据起始值步长等提取目标区域
    im_new.append(im1)



#对分割的图片进行处理
for i in im_new:
          disp(i)
          print('')


input('')

以上程序对下面图片(某网站的验证码)进行处理,



其中起始、步长等 相关取值可以通过ps获取:


注意,ps里面的值需要都加1和减1。


最后的2个结果结果为:



你应该可以看出来就是图片上面的最后2个字符:8和I了吧。


最后可以多采样一些图面并作为特征库,根据内容相同的百分比率进行匹配。

成功率我在本地非完全采样的情况下,基本上是100%成功识别率


针对高级的图像识别技术,可能需要基于RGB、旋转、字体、模板、滤镜、特征码等多种以及结合方式,具体分析具体对待。

以上文章仅提供一种思路。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值