使用selenium自动化测试工具进行页面信息的抓取遇到的坑

为什么选择使用selenium?

  • selenium是一个Web程序测试工具,selenium能解析js,而我平常写的简单爬虫都是爬静态页面,即原始的html,当js改变html的元素时,如果依照原来的那个爬取的html来弄就会出错。
  • selenium支持多种浏览器,Chrome,Firefox,Phantomjs(已经被弃用了,可以使用其他浏览器的无头模式)。重要的事说三遍,Chrome是真的快!Chrome是真的快!Chrome是真的快!,比Phantomjs不知快到哪里去了。

基本使用方法

遇到的问题

  • “selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: element”这个问题是Chrome浏览器和驱动版本不一致造成的,每个驱动支持不同浏览器的版本。详情见http://chromedriver.storage.googleapis.com/index.html。目前最新版的是2.34支持Google的63版本浏览器,比较坑的是它最后面的小数才是标记最新的,像2.9都是比较老的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值