
python
python
奋斗的小G佩奇
这个作者很懒,什么都没留下…
展开
-
ggui:解决python虚拟环境报错“AttributeError: ‘HTMLParser‘ object has no attribute ‘unescape‘”
ggui:解决python虚拟环境报错“AttributeError: 'HTMLParser' object has no attribute 'unescape'”原创 2023-06-15 15:18:13 · 684 阅读 · 0 评论 -
JS逆向解析-笔记《python爬虫使用》
搜索:全局搜索、代码内搜索debug:常规debug、XHR debug、行为debug查看请求调用的堆栈执行堆内存中的函数修改堆栈中的参数值写js代码打印windows对象的值勾子:cookie钩子、请求钩子、header钩子对称加密(加密解密密钥相同):DES、DES3、AES非对称加密(分公钥私钥):RSA信息摘要算法/签名算法:MD5、HMAC、SHA前端实际使用中MD5、AES、RSA,自定义加密函数使用频率是最高的。原创 2022-10-16 14:33:17 · 784 阅读 · 0 评论 -
python爬虫-反爬-验证码
交互式验证码越来越多,如极验滑动验证码需要滑动拼合滑块才可以完成验证,点触验证码需要完全点击正确结果才可以完成验证,另外还有滑动宫格验证码、计算题验证码等。不过我们不能直接转化原图,要将原图转化为灰度图,然后指定二值化阈值,进行二值化处理。这次识别和实际结果有偏差,这是因为验证码内的多余线条干扰了图片的识别。图形验证码,是最简单的一种验证码,这种验证码最早出现,现在也很常见,一般由 4 位字母或者数字组成。那么,针对一些有干扰的图片,我们可以做一些灰度和二值化处理,这样会提高图片识别的正确率。原创 2022-10-16 14:32:25 · 704 阅读 · 0 评论 -
14-转义字符和原生字符
14-转义字符和原生字符原创 2022-10-16 14:21:21 · 126 阅读 · 0 评论 -
14-开始结束和非贪婪
12-开始结束和非贪婪原创 2022-10-16 14:20:21 · 119 阅读 · 0 评论 -
11-正则表达式语法
11-正则表达式语法原创 2022-10-16 14:16:29 · 126 阅读 · 0 评论 -
09-select方法练习题
09-select方法练习题原创 2022-10-16 14:13:45 · 121 阅读 · 0 评论 -
08-select方法
08-select方法原创 2022-10-16 14:12:45 · 99 阅读 · 0 评论 -
07-find和find_all方法
07-find和find_all方法原创 2022-10-16 14:12:00 · 163 阅读 · 0 评论 -
06-遍历文档树
06-遍历文档树原创 2022-10-16 14:11:22 · 119 阅读 · 0 评论 -
05-Beautiful Soup四个常用的对象
05-Beautiful Soup四个常用的对象原创 2022-10-15 23:55:32 · 152 阅读 · 0 评论 -
04-bs4简单使用
04-bs4简单使用原创 2022-10-15 23:54:47 · 146 阅读 · 0 评论 -
02-在lxml中使用xpath语法
02-在lxml中使用xpath语法代码内容为常用的xpath解析不整理了,直接上代码原创 2022-10-15 23:50:51 · 204 阅读 · 0 评论 -
01-lxml解析html代码和文件(python爬虫)
01-lxml解析html代码和文件原创 2022-10-15 23:49:43 · 435 阅读 · 0 评论 -
16-正则表达式-常用函数<python>
【代码】16-正则表达式-常用函数原创 2022-10-15 23:44:23 · 163 阅读 · 0 评论 -
实战-赶集网爬虫requests
如果想要让.代表所有的字符,那么需要在函数后面加re.DOTALL来表示,否则不会代表\n,也就是换行。获取数据的时候,都要用非贪婪模式.如果正则写得不对,那么获取不到结果,程序会假死,这时候可以把你刚刚写的正则删掉,重新运行下,看下程序还会不会假死如果不会假死了,说明正则写得有问题,这是就要去调整了。如果正则写的有问题,那么不要去钻牛角尖,去更换一个思路就可以了。原创 2022-10-15 23:41:45 · 409 阅读 · 0 评论 -
python 修改国内镜像
修改镜像可以让我们下载模块的速度增加因为模块都是从国内的镜像上面获取原创 2022-08-24 11:24:26 · 1679 阅读 · 0 评论 -
scrapy爬虫笔记
scrapy爬虫Scrapy主要包括了以下组件:* 引擎(Scrapy)原创 2022-08-13 01:41:18 · 419 阅读 · 0 评论 -
爬虫之urllib模块
python爬虫之urllib模块原创 2022-08-13 01:35:48 · 105 阅读 · 0 评论 -
2、python之爬虫css属性解析以及2级爬取
代码】2、python之爬虫css属性解析以及2级爬取。原创 2022-08-03 14:52:45 · 919 阅读 · 0 评论 -
【requests爬虫用xpath解析_1】
requests爬虫用xpath解析_1原创 2022-06-27 17:54:03 · 860 阅读 · 0 评论