自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

码王吴彦祖的博客

年轻人,无所畏惧!

  • 博客(196)
  • 资源 (9)
  • 收藏
  • 关注

原创 OCR在线识别网站现已上线!

由作者亲自开发的ocr识别网站哈哈,暂时汇聚了三十多种验证码模型以及算法,欢迎各路朋友去尝试,包括但不限于: - 四六位验证码 - 不定长验证码 - 计算题验证码 - 滑块验证码 - 图标点选验证码 - 文字点选验证码 - 分类选择验证码 - 其他验证码

2024-09-10 18:14:54 1216 5

原创 利用PaddleOCR识别增值税发票平台验证码(开箱即用)

下面直接讲解利用paddleocr识别的思路,为什么使用paddleocr,因为paddle中集成了较好的ocr文字识别模型,开箱即用即可,废话不多说,剑指主题,识别思路步骤如下。

2023-05-25 21:50:21 4079 9

原创 如何训练创建一个聊天自动回复的微信机器人(一)

如何创建一个聊天自动回复的微信机器人(一)这里,本来打算用一个微信号来做机器人的,但是机器人有几个缺点1、如果任意一个人想使用机器人的话,那么必须添加机器人为好友才能使用测试2、基于微信识别异常微信号的自动检测,机器人很有可能被封号o(╥﹏╥)o3、现在想使用微信号做机器人的话,后端对接微信的方法大概有两种,一是使用网页版微信的API进行接入,不过现在网页版的微信已经封的差不多了,这种方法已经过时了,二是使用微信注入dll的方式来对接,不过这种方式也同样会受到微信的异常号自动检测,也会容易封号所

2021-02-22 14:19:53 7639 4

原创 树莓派4B 极简安装教程(通俗易懂)

树莓派4B 极简安装教程(通俗易懂)既然是极简,那么所需要的的工具也是极简:PS:这里树莓派使用笔记本电脑进行安装配置1、树莓派4B 主板2、8G以上tf卡3、读卡器4、typec 电源线5、网线6、笔记本电脑一台下面是成果1、tf卡写入系统用你的tf卡插入读卡器写入一个系统即可,这里自由选择你想要安装的系统树莓派镜像下载这两个或者镜像页面下面的的操作系统都可以,这两个是标准系统,黑色的NOOBS更推荐新手使用,下载好系统后使用烧录工具把系统烧录到tf卡里面就行,这里的烧录工具

2020-09-03 00:10:51 6478 2

原创 Centos7.5 服务器搭建Selenium 爬虫详细教程

Centos7.5 服务器搭建Selenium 爬虫详细教程测试成功时间2020.03.121.安装python我安装的是python3.6需要给服务器安装Python环境最新的EPEL 7仓库提供了Python3(python 3.6)的安装源,如果你使用CentOS7或更新的版本的系统你也可以按照下面的步骤很轻松的从EPEL仓库安装。安装最新版本的EPELsudo yum ins...

2020-03-12 00:35:05 1445

原创 从0搭建一个邮件服务器(用于邮件推送以及邮件群发业务)

本文讲述如何方便快捷搭建一个邮件服务器,由于本人论文以及实习公司需要,将会言简意赅的搭建一个邮件服务器来实现所需功能,以下是实现效果图

2020-02-13 01:57:49 9854 2

原创 三星堆文字点选验证码识别

三星堆的文字点选含有大量生僻字,标题带有部分干扰,识别的本质还是不变的,收集标注生成大量生僻字数据集,通过2w+类别的文字+图像增强生成一个文字识别的大模型即可,识别准确率可到90-95+,识别效果如下。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2025-04-07 14:20:23 131

原创 携程新版图标点选验证码识别

携程的图标分类识别依然换谈不换药,不管使用哪种开源模型进行迁移训练即可,标题可能为3个,可能为4个,并且标题含有通明通道,动态识别标题即可,识别效果如下。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2025-04-07 14:18:58 18

原创 旋转验证码截图识别

这里讲解识别思路前,需要注意一个地方,因为是截图,每个设备分辨率以及截图方式的不同,会导致算法准确度有差异,所以在ocr的demo网站中我上传了三种思路方式,识别方式各有差异,可能你的第一种方式准确率有80,他的第二种方式有80,并且整体截图识别的准确率也无法保证到很高,原因除了上述讲的一种外,还有就是整体图库是很大的

2025-03-10 16:42:34 1150

原创 腾讯空间推理验证码

本文识别已同步上线至OCR识别网站: http://yxlocr.nat300.top/ocr/other/28腾讯空间推理数据集如下:之前说过,空间推理验证码识别的一般通用方式,做三阶段即可,检测-分类-问题识别,当然也可以将检测和分类用yolo作为一阶段去做,本文就是使用这种方法,吃亏了,泛化性很差,鉴于有限集的问题,只需要多几个ifelse即可解决,不需要做nlp的处理,如果在不着急的情况下,还是老老实实做二阶段吧,已经被友军骂了,下面是具体识别效果

2025-03-10 15:50:33 78

原创 阿里图像修复验证码

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。,阿里验证码如上,将图像还原到正确为止即可,还原后如下,具体可以上网站尝试。如有侵犯,请联系作者下架。

2025-02-27 09:56:40 77

原创 funcaptcha手势指向验证码识别

不用于之前的验证码,该验证码在确认物体的同时,还要确认物体角度,由于该物体是一个3D的效果,并且角度360度,也可能去做一个360的分类检测,这样太复杂了,而且很可能没有效果,360分类早在旋转验证码中就提出,是很难拟合数据集的,即使现在拟合了一部分数据集,对没有见过的物体也基本拟合不了,这样就没有做模型的必要了

2025-01-14 17:30:02 444

原创 Temu 旋转滑块识别

temu的旋转滑块和网易易盾类似,都是有两个缺口图,但是滑块的计算角度和距离完全不同,个人认为相较于网易易盾是要更困难一些的,所以,在阅读本文时,如果你有解决过网易易盾滑块验证码的类似经验,阅读起来会更轻松一点,或者也可以先去看看我之前的文章,网易易盾滑块增强版是如何处理的,temu旋转滑块数据集如下:而实战中,滑块是如下进行滑动的,这里大家也可以直接去网站上触发temu滑块。

2025-01-14 16:40:48 195

原创 recaptcha拼多多通用手势验证码识别深入浅出(全流程)

本篇文章包含经验和教训总结,我采用了两种方法进行识别,两种方法都各有优劣,其中一种最后不能满足其成果,但我会介绍经过两种方法得到的经验教训,先看下数据集。

2024-12-30 19:48:03 666

原创 顶象语序点选验证码

通过检测出所有文字的位置,然后准确识别出所有文字,然后再组装成成语,那么很明显,这是一个三阶段任务了,检测+识别+语序,当然,最后的语序可以有很多方法去做,

2024-12-27 14:27:38 306

原创 腾讯文字方向点选验证码识别

要求点击倾斜的文字,通过观察发现,每张图有三个倾斜的文字和一个不倾斜的文字,那我们根据这个特性直接用yolo训练二分类检测即可,下面是成品展示,标签0为倾斜字体,标签1为不倾斜字体。

2024-12-27 14:16:05 211

原创 某集团GIF动态验证码识别

该验证码由固定的五位数字字母或者10以内的计算题组成,gif验证码分很多种形式,有的是通过滑动帧来展示,该验证码则是采用帧隐藏部分验证码,这种验证码虽然每一帧都包含了不同的验证码,但其实处理起来也是非常简单,直接采用帧叠加的方式即可,首先来看下成品展示,在该目录下生成inference模型后,如果想脱离paddle环境,还可以再导出为onnx模型,安装paddle2onnx后即可讲inference模型转换为onnx。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。

2024-12-24 18:52:41 480

原创 极验图标方向点选验证码识别

这种反而是最简单的,只需要8分类接口,总共8个方向,图标的检测依然可以用dddd或者自己训练一版,这种图标几百张就能训练处一个不粗的效果了,下面来看成品展示。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。极验图标方向类数据集如下,根据图标的箭头选择相同方向的物品即可。注意:本文是篇水文,主要展示图标识别的成果。如有侵犯,请联系作者下架。

2024-12-24 18:08:30 722 2

原创 拼多多双缺口滑块识别

拼多多双滑块数据集如下,可以看到,正确的缺口和错误的缺口从缺口轮廓上来看是不一样的,有的小伙伴就会想到使用模板匹配去识别,这里最大的一个坑就是,实际上模板匹配是匹配整个图标的像素,而不单单是匹配轮廓,实际上,轮廓的影响微乎其微,并且,错误的缺口背景跟正确的图标背景其实是一模一样或者说非常相似的,如果使用模板匹配,百分之99应该是会匹配到错误的缺口上去,本文使用的方法,最终准确率可以达到90-95。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2024-12-16 11:35:55 367

原创 amazon亚马逊滑动识别验证码

和某顶象的差不多,图片分割高度是中间固定的,需要注意的是,他并不是把五副图像还原就行,它需要根据题目,还原指定的物品种类,那么这里必然还是要训练分类模型,这里我们只采集上半张图,由于每张物品种类是有明显的分割间隙的,也就是白色区域的图案,放大如下。随后导出成onnx模型,为下一步做准备,由于分割的高度是固定的160,我们在计算分割每个物品后,需要将分割位置坐标计算出来。那么我们即可利用这个特性,将图案分割下来,并且,我们已知所有图像的种类,我们人工筛选种类部分数据集即可。如有侵犯,请联系作者下架。

2024-12-09 15:21:35 154

原创 腾讯混元AI验证码动物类语义识别

使用yolo标注还是按照正常的图标去标注即可,当然,你不止需要标注动物的种类,你还要顺带记录动物的颜色、状态,无非是一个类型扩增到几种类型而已,当然这里标注,也有个取巧的办法,使用GroundingDINO去辅助标注,该模型之前我有讲过,这就是一个多模态的模型,只不过同样,他也不会记录动物的颜色状态,在辅助标注的情况下,仍然需要你修改部分标注,不过对比之前,肯定是剩下了很多时间的,用该模型辅助标注,只需要通过xanylabelimg,点击如下AI图标。随后在上方下拉框中选择GroundingDINO既可。

2024-12-03 16:54:21 547

原创 腾讯最新图标点选验证码

这里的点选最好采用两阶段的方法,即检测+识别,这样可以最好的提升图标抗更能力,出现类似的图标也能够很快的检测出来,至于识别,用分类或者孪生都行,分类和孪生本质上并无差别,你习惯用哪个即可,另外,如果你不考虑高准确率的话,也可以使用sift特征点检测来匹配两个图标的相似度,好处就是,只需要一个检测模型就够了,缺点是经过实测,准确率可能只有百分之50,因为背景上部分图标的干扰确实很严重,ok,这里就说到这了。不仅新增了背景图片还新增了图标种类,但是这样依然没什么好说的,使用yolo检测就可以,具体效果如下。

2024-12-03 16:40:06 250

原创 某东图标点选验证码

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。京东图标点选验证码没什么好说的,做检测就行。如有侵犯,请联系作者下架。

2024-11-29 13:43:14 170

原创 京东最新黑边背景旋转验证码识别

下面重头戏就来了,为了提高整个图像的匹配程度,还需要将多余的像素去掉,以我们人眼之直观的匹配来看,就是将缺口圆的内部边缘和外部边缘相匹配即为匹配成功,所以这里我们再来切割一下空心圆部分,这里我选择切割了15个像素,效果如下。接下来还是老样子计算梯度了,以每5个像素循环,去计算一次梯度,梯度最小即为成功的角度,最后找到最小的角度,我们再次拼接一下,得到效果图,如下。我之前的文章有讲到过如何处理不固定大小的缺口图片,就是将缺口图片进行切割,计算出完整的缺口半径

2024-11-21 14:07:19 506 1

原创 京东AI单旋旋转验证码98准确率通杀方案

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。京东单旋验证码最近更新了,使用AI生成,要求识别角度。

2024-11-08 17:45:46 643

原创 目标点选验证码识别新高度,GroundingDINO通用目标检测大杀器

点选验证码,大家用过的最多应该就是yolo了吧,现在yolo已经出到v11系列了,目前最常用的版本还是老版v5或者上一代v8,其实自从v8开始yolo就已经按照v8的框架去迭代更新yolo检测器了,yolo的性能和精度都是毋庸置疑的,但是yolo检测器仅仅只停留在视觉层面,并且如果你需要处理自定义数据,并围绕其定义标注,那可能会有些耗时,于是我找到了完美的解决方案——

2024-11-01 16:26:14 597

原创 实干派!网易易盾增强版滑块验证码,全方位讲解识别思路(含源码)

该验证码是异形滑块验证码中的一种,缺口旋转+偏移的处理需要你有很好的图像处理知识,能很好的处理透明通道,同时,该验证码需要你能很好的处理缺口和背景之间匹配的关系,该验证码的处理难点就是两个缺口之间如何找到正确的,两个检测框都有很强的相似度,且加上背景图的干扰,在图像处理和有优化上难度大大增加。

2024-11-01 11:11:45 816 2

原创 tiktok双旋转验证码识别,利用图像处理技术准确率达97

这里计算角度也还是和以往一样,计算梯度,但是这里的梯度也必须优化好,每一步优化都是为了最后的准确率,这里防止代码滥用,就不贴出来了,只要计算出差异最小值就是最终角度,经过还原后,正确角度图如下:总结,这里的旋转验证码和以往不同,需要你对每一步的图像处理上掌握的比较熟悉,会使用各种图像处理方法正确处理好外圈图和内圈图的关系,并且在关键阈值上都要进行像素级的优化处理,最后才能得到比较高的准确率。

2024-10-29 18:12:07 822

原创 京东文字点选验证码识别

这就是典型的利用透明通道来造成显示文字的效果,这里针对透明的还原也需要注意,因为单纯的去计算通明通道,可能还会造成识别效果不准的问题,这里读取可以看到RGB的数值均为0,那么只需要在还原RGB时,考虑alpha通道去输出RGB即可,通过以下代码转换后即可。该文章模型已经上线ocr识别网站,欢迎测试!,地址:https://yxlocr.windy-rain.cn/ocr/textclick/7。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2024-10-29 17:48:12 363

原创 拒绝水文满满干货,教你如何破解各种滑块验证码(内含源码)

今天是1024程序员节,我在优快云上正式发文已有两年之多,我刚开始学爬虫时,由于我接触这块内容还比较早,所以我最初开始做专栏就是OCR识别,逆向的知识是一点没学,当时觉得学AI方面的挺有意思,我几乎是把所有的精力用于学习图像处理、深度学习这些内容上,这方面的书籍我也买了许多本文大致将从滑块验证码的。

2024-10-24 15:25:12 326 3

原创 验证码生成对抗CLIP(腾讯分类生成模型)

通过回答问题来识别以上验证码,例如一只狗,点击仙人掌等等,那么我们针对问题的分类也可以使用clip模型来识别

2024-10-17 13:50:13 204

原创 腾讯图标点选模型识别

该文章模型已经上线ocr识别网站,欢迎测试!,地址:https://yxlocr.windy-rain.cn/ocr/iconclick/2。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。如有侵犯,请联系作者下架。

2024-10-15 17:06:34 211

原创 某眼查10.12最新风控极验4逆向if-match

可以看到,相对于提交极验4验证过后的参数,在header中还多了一个if-match参数,这也是唯一的额外参数校验,当我们把if-match参数补齐后,再次提交就能通过验证,效果如下。极验4的参数不再多说,只需要通过任意一种验证码后拿到验证后的参数即可,这里我们着重分析if-match,我们打上xhr断点后,发现在这个位置已经生成。注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路。极验4没什么好说的,还是老一套了,我们来看最终提交的参数。下面来看具体分析过程。

2024-10-15 10:11:33 508

原创 某乎登录加密以及zseck加密逆向

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路如有侵犯,请联系作者下架某乎的登录除了需要通过网易易盾外,登录还需要传额外的加密data参数,某盾的加密可以看我之前的文章,这里着重讲解登录以及后续ck的加密,将最终的的登录采集代码整合后,就可以拿到文章内容,先来看下效果图。

2024-10-09 14:01:41 520 4

原创 某象异形滑块99%准确率方案

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路如有侵犯,请联系作者下架。

2024-10-08 17:41:04 250

原创 顶象生僻字点选模型识别

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路如有侵犯,请联系作者下架。

2024-10-08 17:24:10 365 2

原创 某易易盾验证码逆向

此时的代码简介明了,其中需要传入的参数有token,偏移量,偏移数组,偏移加密数组,调用的方法有G、N、J、j,我们先看一下加密方法如何生成,往上查找代码。此时,加密方法已经完成,剩余的一个加密变量为偏移加密数组,加密轨迹肯定是在鼠标移动中生成,此时细心的小伙伴能够发现,就在该代码的上方就有move方法,其中的C5就是偏移数组,而C6就是加密数组,这里的J也是由加载器得到的,至此,就已经解决了所有加密问题,其实整体也是非常的简单,我们将所有的代码做拼接。我们跟栈进去查看代码,在如下位置断住。

2024-09-24 19:01:56 309

原创 某yandex图标点选验证码逆向

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路如有侵犯,请联系作者下架,本文网址如下,使用base64解码获得:打开网址,点击我不是机器人出现验证码,如下:我们随机点击几个坐标提交表单后,根据抓包可得提交的url为checkcaptcha来看一下参数首先看一下params的参数,发现params的参数全部来源于showcaptcha这个接口,再展示验证码时,已经附带了提交验证码所需要的params参数。

2024-09-24 10:52:24 711

原创 某东不固定大小旋转验证码识别

旋转验证码基本是旋转小图到一定的角度去匹配大图的,通常的旋转验证码,中间缺口图部分大小固定,但是在某东上,大小不固定

2024-09-20 11:16:57 380

原创 顶象图标点选模型识别

顶象图标验证码识别训练

2024-09-10 17:32:22 205

300个计算题样本,计算题验证码

300个计算题样本,计算题验证码

2022-06-09

6万数字英文随机生成干扰样本,含较强噪声

6万数字英文随机生成干扰样本,含较强噪声

2022-06-09

四位英文带干扰,四位随机英文数字带干扰验证码

四位英文带干扰,四位随机英文数字带干扰验证码

2022-06-09

46位验证码,共7中类型

46位验证码,共7中类型,共4000多张图片,全部已标注好,可以用来训练4,6位验证码的数据集,非常好用

2022-04-24

计算题数据集,共500张图片左右,已标注好,*号已用$号代替

一位数字加减乘法数据集,基本全覆盖所有已出现的可能

2022-04-24

滑块数据集已标注,单个背景图,共300张图片

滑块数据集已标注,单个背景图,共300张图片

2022-04-24

教育机构信息数据.rar

教育机构信息数据,内含主要城市的主要门店信息数据,所有数据总计8万条左右

2021-12-14

剧本杀所有城市门店数据.rar

剧本杀所有城市门店数据,包含22个城市,所有数据总计十万条

2021-12-14

VRoot491292.exe

requests_html 最新哭 render js渲染浏览器

2019-08-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除