
爬虫
你好啊,陌生人
这个作者很懒,什么都没留下…
展开
-
突破网站对selenium的检测
网站对selenium的检测,主要是通过window.navigator.webdriver的值来判断,正常打开浏览器请求这个值为undefined,selenium打开为true,so通过上面option来解决这个问题。解决的话,记得点赞。...原创 2019-08-20 23:58:52 · 1658 阅读 · 4 评论 -
Chrome驱动对应chrome浏览器版本
使用selenium时,要确保所用的chrome浏览器跟chrome驱动版本对应,否则就会报错。驱动下载地址http://chromedriver.storage.googleapis.com/index.html原创 2019-04-02 10:17:49 · 3882 阅读 · 0 评论 -
python headers键值对 添加引号
ctrl + F ===> (.+): (.+)$ctrl + R ===> ‘$1’:’$2’原创 2020-11-19 11:12:10 · 819 阅读 · 0 评论 -
python execjs
用python 中的execjs来运行js代码,发现报错,说ReferenceError: window is not defined可以用node里的jsdom,这个库可以生成对应环境https://www.npmjs.com/package/jsdom全局安装命令npm i jsdom -g之后在对应js代码里最前面加上以下代码就能正常运行const jsdom = requir...原创 2019-09-14 21:59:54 · 1963 阅读 · 0 评论 -
如何解决出现debugger无法调试
so,之前有一篇只是简单的把断点给终止,本次将解决一下网站中常见的debugger上图:很多网站F12一开启直接就进入debugger,上图这样的在console里面重新定义该函数向下执行会进入到另一个debugger位置,如下图:这个根据时间来debugger的也是上篇文章中所遇到的,这次咱们来看一下怎么解决掉它,来实现可调试,首先回调栈里面去找关键位置发现该方法是前面那个时间...原创 2019-09-12 06:43:41 · 20057 阅读 · 2 评论 -
爬虫遇到debugger无法F12查看如何破
如下图,F12进来,直接会debugger,解决办法如下:点击该按钮,重新刷新页面即可so,可以继续查看network了,不过这种方法并没有解决debugger的存在,若要js逆向还需要其他的办法。...原创 2019-08-20 07:09:51 · 10055 阅读 · 0 评论 -
爬虫模拟登陆的几种方法
1.使用urllib.request 底层库 使用cookiejar保存cookie2.使用requests 时 使用session来保存cookie3.代码登陆 使用带有cookie的session去请求目标网址 来实现抓取需要登录才能爬取的数据...原创 2019-02-28 17:19:15 · 963 阅读 · 2 评论