selenium模拟浏览器打开页面,获取页面资源
from selenium import webdriver
import time
import os
# driver = webdriver.PhantomJS()
# 构建处理器对象 Phantommjs是一个无界面的浏览器
driver = webdriver.Chrome()
driver.get('http://www.baidu.com/')
time.sleep(2)
# 获取id为wrapper的标签的文本内容
data = driver.find_element_by_id("wrapper").text
print(data)
# 打印页面标题
print(driver.title)
# 生成当前页面的快照并保存
os.mkdir('image')
driver.save_screenshot('image/baidu01.png')
# id="kw"是百度搜索输入框 输入字符串 "飞剑问道"
driver.find_element_by_id("kw").send_keys("飞剑问道")
# id="su"是百度搜索按钮 click模拟点击
driver.find_element_by_id("su").click()
# 获取搜索后的页面快照
time.sleep(2)
driver.save_screenshot('image/baidu02.png')
# 打印网页渲染后的源代码
print(driver.page_source)
print('----------------')
# 获取当前页面的cookie
print(driver.get_cookies())
time.sleep(2)
# 清除输入框内容
driver.find_element_by_id("kw").clear()
print('-----------------')
print(driver.current_url)
# 关闭当前页面
driver.close()
# 关闭浏览器
driver.quit()