按照惯例,第一篇博客的第一段贡献给伟大的“Hello,World”
书归正转,python爬虫的用处我就不用多说,教程有的是,但是大部分是用requests+beautifulsoup设计的爬虫程序。但是这两个基础是基础,想要实现稍微复杂点的功能就要用很长的篇幅,显然这不符合python简洁的特点嘛,于是乎上网学习了一点关于一个强大python爬虫库–selenium库,这个库的详细介绍请移步:https://baike.baidu.com/item/selenium/18266。In conclusion, 就是一个模仿人类进行浏览器自动化测试的工具,用好了可以模拟人一切使用浏览器的习惯,比如这页看完自动翻页等等。安装和教程也贴上:https://selenium-python-zh.readthedocs.io/en/latest/
不要想着多难,我这种超级菜鸡动手模拟一遍就会了哈哈。
话不多说,上代码!
#测试网站:https://www.xzbu.com/ 爬论文网站总感觉不道德,还是尊重作者版权吧...
#导库,不多bb
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
import time
#加载谷歌浏览器驱动,这个是必须的,除了加载外,也要到官网上下载相对应的Chorme Driver版本,链接贴上:http://npm.taobao.org/mirrors/chromedriver/
browser = webdriver.Chrome()
#获取当前网址
browser.get("https://www.xzbu.com/")
# 提交关键字
key = browser