Selenium 批量执行url(附完整代码)

本文介绍了一种使用Python和Selenium库批量抓取本地URL链接文件中的网页内容的方法。通过PhantomJS浏览器对象,实现自动加载指定URL并执行下拉操作,确保页面完全加载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python环境

3.6.6

本地URL链接文件

  1. https://blog.youkuaiyun.com/fly910905/article/details/83418623
  2. https://blog.youkuaiyun.com/fly910905/article/details/83417911
  3. https://blog.youkuaiyun.com/fly910905/article/details/83144267
  4. https://blog.youkuaiyun.com/fly910905/article/details/83143153
  5. https://blog.youkuaiyun.com/fly910905/article/details/83055987
  6. https://blog.youkuaiyun.com/fly910905/article/details/83022524
  7. https://blog.youkuaiyun.com/fly910905/article/details/82868342
  8. https://blog.youkuaiyun.com/fly910905/article/details/82869328
  9. https://blog.youkuaiyun.com/fly910905/article/details/82869344
  10. https://blog.youkuaiyun.com/fly910905/article/details/82800533

Python完整代码

  1. # 导入 webdriver
  2. from selenium import webdriver
  3. # 读取本地文件中的URL链接
  4. address = './url.txt'
  5. fp = open(address, 'r')
  6. lines = fp.readlines()
  7. print('【URL链接】:%s', lines)
  8. # 调用环境变量指定的PhantomJS浏览器创建浏览器对象
  9. driver = webdriver.PhantomJS()
  10. # 如果没有在环境变量指定PhantomJS位置
  11. # driver = webdriver.PhantomJS(executable_path="./phantomjs"))
  12. for data in lines:
  13. # get方法会一直等到页面被完全加载,然后才会继续程序,通常测试会在这里选择 time.sleep(2)
  14. driver.get(data)
  15. # 向下滚动10000像素
  16. js = "document.body.scrollTop=10000"
  17. # js="var q=document.documentElement.scrollTop=10000"
  18. # 执行JS语句
  19. driver.execute_script(js)
  20. # 查看页面快照
  21. # driver.save_screenshot("csdn.png")
  22. print('执行中。。。')
  23. # 关闭浏览器
  24. driver.quit()
  25. print('执行结束。。。')
  26. # 关闭文件流
  27. fp.close()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值