
爬虫
python爬虫
帅九妹
这个作者很懒,什么都没留下…
展开
-
爬虫--selenium使用心得
超级鹰验证码识别反时间戳反爬机制在自动化操作党课时发现,党课登录界面的验证码采用了时间戳反爬,在我获取到图片服务器地址后,再向这个地址发起请求时,会自动更改后面的时间戳,查网页源码发现:于是采用selenium截屏操作进行验证码识别。1.找到该元素2.使用screenshot方法截屏坑在爬取表格的时候,用xpath解析数据时,不要写tbody,xpath在处理文档时候把他给剔除了...原创 2021-04-09 11:38:08 · 239 阅读 · 0 评论 -
爬虫--简单的爬虫及其反爬机制
获取一个get请求try: response=urllib.request.urlopen("http://www.baidu.com",timeout=1) print(response.read().decode('utf-8')) #对获取到的网页进行utf-8解码 except urllib.error.URLError as e: #获取...原创 2020-11-23 13:36:18 · 153 阅读 · 0 评论