selenium模块是基于浏览器自动化的一个模块.
1.selenium安装
pip install selenium
2.实例化一个浏览器对象
新版本selenium无需下载驱动程序
from selenium import webdriver
webdriver.Chrome()
3.发起请求
from selenium import webdriver
chr=webdriver.Chrome()
chr.get("https://www.taobao.com")
4.获取浏览器当前页面的源码数据
page_text = chr.page_source
5.标签定位
from selenium.webdriver.common.by import By
#定位id
chr.find_element(By.ID,value="")
#name
chr.find_element(By.NAME,value="")
#class_name
chr.find_element(By.CLASS_NAME,value="")
#tag_name
chr.find_element(By.TAG_NAME,value="")
#link_text
chr.find_element(By.LINK_TEXT,value="")
#partial_link_text
chr.find_element(By.PARTIAL_LINK_TEXT,value="")
#class_selector
chr.find_element(By.CLASS_SELECTOR,value="")
#xpath
c