
selenium
文章平均质量分 73
zhaojiafu666
保持好奇心,开始养成记录学习笔记的习惯吧,加油!!!
【我坚信】:学习中遇到问题时,要习惯于多思考,根据已经掌握的知识举一反三;搞不懂的,可以使用Google搜索引擎,大部分常见的问题都会有答案;遇到问题不论大小马上就去请教“高手”不是明智之举,自己研究出来的答案远比你从“高手”那里得到的现成答案要记忆深刻,也更有利于你今后的学习。希望自己成为高手的人,从不会放弃自己独立思考问题的机会。
展开
-
selenium 指定element下拉指定距离方式
文章目录需求描述需求描述老早之前用过selenium,写过一篇文章,不过指定元素element下拉,使用的js方法,driver执行元素。之前的文章:python 之使用selenium滑动页面下拉方式但是那种方法需要使用document.getElementsByClassName或者document.getElementById来指定元素。但是如果没有id,class结果有很多,所以如果可以使用xpath选择元素,就可以了。发现selenium获取的元素,只有get_attribute,获取原创 2022-04-08 15:20:32 · 1169 阅读 · 0 评论 -
爬虫必备:centos7 安装 chromedriver
文章目录安装步骤:1、安装浏览器:2. 安装chromedriver1)、查看目前的chrome浏览器版本:2)、然后去下载对应的chromedriver3)、unzip解压4)、建立软连接或者复制、移动过去3、Python脚本测试:参考安装步骤:1、安装浏览器:指定yum 源wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo安装curl https://intol原创 2021-06-22 17:36:14 · 1542 阅读 · 0 评论 -
selenium 之切换标签页
文章目录一、需求二、需要的几个命令:一、需求我想要的是,比如百度搜索结果,出现的标题点击,跳转之后,获取跳转的页面html,然后关闭跳转的,回到主页面,再次点击下一个结果。二、需要的几个命令:# 1、获取所有标签页window_handles = driver.window_handlesprint("window_handles",window_handles)# 切换最后一个标签页driver.switch_to.window(window_handles[1])current_url原创 2020-10-12 11:39:15 · 3972 阅读 · 0 评论 -
centos 7.2 下执行selenium+ Firefox 报错:Message: ‘geckodriver‘ executable needs to be in PATH.
文章目录问题:解决方法--删除root下`geckodriver.log`问题:突然发现服务器上的报错,Message: 'geckodriver' executable needs to be in PATH.之前的代码是使用selenium +Firefox,是没有问题的,今天就突然有问题了,手动使用python3 + 代码也是没有问题的,就是使用定时任务crontab执行时会报错。解决方法–删除root下geckodriver.log找了一上午都没有解决,最终,将root目前下的geck原创 2020-07-10 14:03:29 · 516 阅读 · 0 评论 -
selenium报错之---Message: session not created: Chrome version must be between 71 and 75
文章目录1、问题说明2、解决问题的步骤:1、看下我的谷歌版本2、下载当前谷歌浏览器版本最新的Chromedriver:3、加压放到固定不动的位置,然后把之前的删了,并且添加到环境变量中1、问题说明由于好久没有在家里电脑测试selenium了,今天用来测试一个程序,调用谷歌的。但是发现确报了一个错误:selenium.common.exceptions.SessionNotCreatedExc...原创 2019-11-17 15:09:37 · 3412 阅读 · 0 评论 -
selenium之等待页面(或者特定元素)加载完成
文章目录需求:1、显示等待(推荐)2、隐式等待(也不错)3、time.sleep(一般不推荐)需求:有时候,我们使用selenium用来获取一些元素时,需要等待页面将某些元素加载网站才能够获取我们需要的数据,所以,这时候我们就需要等待页面的功能。1、显示等待(推荐)显式等待是你在代码中定义等待一定条件发生后再进一步执行你的代码。 最糟糕的案例是使用time.sleep(),它将条件设置为等...转载 2019-08-05 14:44:46 · 54479 阅读 · 12 评论 -
python 使用selenium 批量获取url的cookies
文章目录需求:有时候有些网站的反爬对cookies有限制,批量获取cookies代码使用说明:主要你要对于你需要批量获取cookies的网址多个url搜集,我自己找了100多个地址吧,放到detail_url.txt文件里面,你把这个替换成你需要的而地址,就可以直接用代码了。如果有帮助,可有给我点个赞哈原创 2019-07-22 10:41:10 · 2566 阅读 · 0 评论 -
python selenium Chrome 添加代理ip最全俩种方式(无密码+有秘密)
文章目录说明:1、无密码(ip+port):2、有账号和密码的代理ip(这个就是我花了几个小时找到一个不错的)注意:substitute方法其实就是字符串拼接的方法,甚至你换成format方法拼接都可以的。说明:今天需要使用selenium测试一下携带含有账号+密码的代理ip,以为和无密码一样简单,但是弄了好久(将近3个小时吧。。。)最后看了很多博客,谷歌百度什么都搜索,最终找到了比较好用的方...转载 2019-07-19 16:14:40 · 7904 阅读 · 3 评论 -
python 使用selenum之模拟登陆只需俩步
文章目录***需求***:**1、之前的笨方法****2、简单方法**简单方法步骤:步骤1获取cookies列表:步骤2:需求:有些网站的一些网页需要登陆才可以的。这时候就是需要借助python的selenium的模块,我突然找到一个更方便的方法。1、之前的笨方法先说一下我之前用的笨方法,之前是模拟一个招聘网站,至于那个网站就不公布了,然后我再网站如下图(原创 2019-05-22 09:54:41 · 451 阅读 · 0 评论 -
selenium之添加cookies模拟登录
我的是Google浏览器,测试好了好久,网上也找了不少博客来看,最终还是弄好了。cookie_1 = { 'name':'JSESSIONID', 'value':'改为你需要自己的', "domain": "passport.lagou.com", "expires": "", 'path': '/', 'httpOnly': False, ...原创 2019-05-13 19:28:50 · 1297 阅读 · 0 评论 -
selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: element
1、说明:当我使用selenium爬虫训练获得的列表时,中间报了这个错误,感觉很纳闷,没有问题怎么会出异常呐,所以就百度了一下,找到了一个对我这种情况的方法:最后找到原因就是如果循环使用自己之前定位的元素发生变化,至于为什么,我也不太懂。...原创 2019-04-28 16:13:00 · 5522 阅读 · 0 评论 -
selenium之常见异常
selenium的常见异常Exceptions(异常)Python 自带的异常,所有异常的基类。异常: selenium.common.exceptions.ElementNotSelectableException(msg=None, screen=None, stacktrace=None)依据: selenium.common.exceptions.InvalidEleme...转载 2019-04-18 16:25:35 · 1297 阅读 · 0 评论 -
python 之使用selenium滑动页面下拉方式
若要对页面中的内嵌窗口中的多个滚动条进行操作,要先定位到该内嵌窗口,在进行滚动条操作使用这个方法:(其中,scall是这个div的class的名字,如过就一个这种div,直接中括号后面用0就可以,如果多个滑动div的class的name一样,需要先找找你需要下拉的div是第几个,如果是第三个,把下面[0],改为[2]) js='document.getElementsByClassName("...原创 2019-04-18 15:34:34 · 14764 阅读 · 4 评论