第一次听说可以不用神经网络识别验证码,觉得十分的神奇。下载下代码瞅了一眼,其实是通过待识别的验证码与已标注的图片计算相似度得到相关系数。对验证码的整齐程度要求比较高,扭曲、变形都无法正常识别。
图片截取
验证码中包含多个数字,需要将其截取为单个数字的图片才能进行相关性计算。首先需要根据颜色将数字提取出来,选择像素为220或227的位置保存。新建一个格式为"1"的图片将位置信息重新保存为图片。

随后遍历每一列,不包含任何像素的一列视为起始或结束的位置。
for num in range(target.size[0]):
cur=True
for y in