
Selenium
文章平均质量分 51
野生猕猴桃
制怒慎思,明辨笃行。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
linux中配置selenium依赖环境
1 下载相关包并安装到服务器1.1 chrome官网下载chrome稳定版,https://www.ubuntuupdates.org/ppa/google_chrome?dist=stable,下载deb格式安装包1.2 chromedriver去淘宝镜像下载 http://npm.taobao.org/mirrors/chromedriver/,下载时与chrome版本对应1....原创 2019-05-15 17:10:53 · 1324 阅读 · 1 评论 -
mitmproxy拦截请求替换js规避selenium检测
有的网站有对webdrive这东西有检测,检测关键就是在js中植入这玩意一、解决方法一种是通过 mitmproxy 拦截请求替换掉这段js,python安装库 pip install mitmproxytextnow_mit.py# -*- coding: utf-8 -*-from mitmproxy import ctxdef response(flow): if 'textnow' in flow.request.url: for webdriver_key原创 2021-03-09 14:43:06 · 2064 阅读 · 3 评论 -
Chrome DevTools协议之Page.captureSnapshot
我的项目需求是这样的:在无headless的情况下实现保存mhtml格式的网页,假如允许有头的话我可以用ctrl+s模拟人工保存页面的方式加上selenium带的chromeOptions.add_argument(’–save-page-as-mhtml’) 功能即可实现,但是考虑到部署服务器以及效率等问题需要在无headless的模式下是最理想的,经过翻阅资料了解到了Chrome DevTools谷歌浏览器开发者工具远程调试协议中的Page.captureSnapshot方法来实现我的需求,代码如下(原创 2020-08-14 18:31:09 · 1849 阅读 · 0 评论 -
selenium的常用方法
Selenium的常用方法,以Chrome为例获取驱动对象browser= webdriver.Chrome()browser.set_page_load_timeout(10) # 页面加载超时时间browser.set_script_timeout(10) # 页面js加载超时时间浏览器配置项from selenium.webdriver.chrome.options import Optionsoptions = Options()browser= webdriver.Chro原创 2018-12-04 21:02:19 · 638 阅读 · 0 评论