Day5_selenium

Day5_selenium

selenium基础

  1. 创建浏览器对象

浏览器对象如果是局部变量,那么函数结束后,浏览器会自动关闭,如果是全局变量,浏览器需要手动关闭.

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
b = webdriver.Chrome()
  1. 打开网页
b.get('https://www.jd.com')
  1. 获取网页内容

    注意:在获取浏览器page_source值的时候,只能获取当前浏览器已经加载出来的数据

print(b.page_source)
  1. 获取网页内容
    1. 输入框操作 - 获取到输入框 ->输入内容 ->按回车
# 根据id值获取输入框
input = b.find_element_by_css_selector('#key')
# 在输入框中输入丝袜
input.send_keys('电脑')
# 在输入框按回车
input.send_keys(Keys.ENTER)
# 获取按钮标签
search_bth = b.find_element_by_css_selector('.button.cw-icon')
# 点击按钮
search_bth.click()
  1. 回退,前进和关闭网页
# 回退
b.back()
# 前进
b.forward()
# 关闭网页
b.close()

selenium选项卡

from selenium import webdriver
import time

b = webdriver.Chrome()
b.get('https://www.jd.com')
# 获取秒杀标签a标签
miaosha = b.find_element_by_css_selector('#navitems-group1>li>a')
miaosha.click()
# 获取所有选项卡
print(b.window_handles)
time.sleep(10)
# 切换选项卡
b.switch_to.window(b.window_handles[0])

selenium获取网页

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
b = webdriver.Chrome()
b.get('https://taobao.com')
input = b.find_element_by_css_selector('#q')
input.send_keys('电脑')
input.send_keys(Keys.ENTER)
# 进入到登录页面,等待人工操作登录页面
time.sleep(20)
print('人工操作结束')
# 人工登录成功后获取cookie值并且保存到本地文件中
cookies = b.get_cookies()
print(cookies)
with open('./file/taobao_cookies.txt', 'w', encoding='utf-8') as f:
    f.write(str(cookies))

selenium获取网页cookie值

b = webdriver.Chrome()
b.get('https://taobao.com')
# 设置cookie值
with open('./file/taobao_cookies.txt', 'r', encoding='utf-8') as f:
    cookies = eval(f.read())
    for cookie in cookies:
        if cookie['secure']:
            b.add_cookie(cookie)
time.sleep(2)
b.get('https://taobao.com')
input = b.find_element_by_css_selector('#q')
input.send_keys('电脑')
input.send_keys(Keys.ENTER)

selenium页面滚动

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
from bs4 import BeautifulSoup

def get_net_data():
    global b
    b = webdriver.Chrome()
    b.get('https://www.jd.com')
    input = b.find_element_by_css_selector('#key')
    input.send_keys('电脑')
    input.send_keys(Keys.ENTER)
    time.sleep(5)
    # 在网页中获取最大网页高度,检查console,输入document.body.scrollHeight,获取最大高度
    max_height = 11809
    # 每次滚动的位置
    y = 0
    while True:
        y += 500
        b.execute_script(f'window.scrollTo(0, {y})')
        if y > max_height:
            break
        time.sleep(1)
    return b.page_source


def an_data(data):
    soup = BeautifulSoup(data, 'lxml')
    li_list = soup.select('#J_goodslist>ul>li')
    print(len(li_list))
    print(li_list)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值