selenium+chromedriver安装及简单使用

本文介绍了如何安装selenium和chromedriver,包括通过pip安装selenium,从官方下载并配置chromedriver,以及如何设置环境变量。最后,展示了利用selenium爬取火猫TV主播节目的基础用法。
部署运行你感兴趣的模型镜像


一. 安装 selenium

pip install selenium

二. 安装 chromedriver

https://sites.google.com/a/chromium.org/chromedriver/downloads

解压后里面是一个exe文件,有两种选择:

 1.每次使用手动增加路径:

#手动添加路径
path = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver\chromedriver.exe"
driver = webdriver.Chrome(executable_path=path)

2. 添加环境变量path,增加chromedriver所在的目录


三. 简单实现,爬取火猫TV的主播节目数据

from selenium import webdriver
from bs4 import BeautifulSoup
from pandas import DataFrame
import time

#手动添加路径
path = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver\chromedriver.exe"
driver = webdriver.Chrome(executable_path=path)

url = "https://www.huomao.com/channel/lol"

#司机开车了
driver.get(url) 

#让页面移到最下面点击加载,连续6次,司机会自动更新!!
for i in range (6):
    driver.find_element_by_id("getmore").click()
    time.sleep(1)

#开始解析   
soup = BeautifulSoup(driver.page_source,"html.parser")
page_all = soup.find("div",attrs={"id":"channellist"})
pages = page_all.find_all("div",attrs={"class":"list-smallbox"})

name =[]
title =[]
watching =[]

for page in pages:
    tag = False
    try:    
        this_title = page.find("div",attrs={"class":"title-box"}).find("em").string.strip()
        temp = page.find_all("p")
        this_name = temp[1].find("span").string.strip()
        this_watching = temp[1].find_all("span")[1].string.strip()
        tag = True
        if tag:
            title.append(this_title)
            name.append(this_name)
            watching.append(this_watching)
    except:
        continue        
result = DataFrame({
        "主播名":name,
        "节目名":title,
        "在线观看人数":watching
        })
    
#没有文件会自动创建
result.to_excel("E:\\resultLol.xlsx",sheet_name = "Sheet1")





您可能感兴趣的与本文相关的镜像

Python3.10

Python3.10

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

### 一、SeleniumChromedriver简介 Selenium 是一种用于自动化浏览器操作的工具,广泛应用于 Web 应用程序的功能测试和性能测试。ChromeDriver 是一个独立的可执行文件,用于控制 Google Chrome 浏览器实例,使 Selenium 能够与 Chrome 浏览器交互[^1]。 ### 二、安装与配置步骤 #### 1. 安装 Selenium 确保系统中已安装 Python 环境后,可以通过以下命令安装 Selenium: ```bash pip install selenium ``` #### 2. 查看 Chrome 浏览器版本 在安装 ChromeDriver 之前,需要确认本地安装Chrome 浏览器版本。打开 Chrome 浏览器,进入设置页面,点击“关于 Chrome”,即可查看当前版本号[^3]。 #### 3. 下载并配置 ChromeDriver 根据 Chrome 浏览器的版本号,从官方下载地址下载对应的 ChromeDriver 版本[^4]: ```bash wget http://chromedriver.storage.googleapis.com/<version>/chromedriver_linux64.zip unzip chromedriver_linux64.zip ``` 将解压后的 `chromedriver` 文件移动到系统的 PATH 环境变量路径下,例如 `/usr/local/bin`,以确保全局可用[^1]。 #### 4. 配置环境变量 如果未将 ChromeDriver 添加到系统 PATH 中,则需要在代码中指定其路径。例如: ```python from selenium import webdriver driver = webdriver.Chrome(executable_path='/path/to/chromedriver') driver.get("https://www.baidu.com") ``` ### 三、使用示例 以下是一个简单Selenium 自动化测试代码示例,演示如何打开百度首页并搜索关键词[^2]: ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys # 初始化 Chrome 浏览器驱动 driver = webdriver.Chrome() try: # 打开百度首页 driver.get("https://www.baidu.com") # 定位搜索框并输入关键词 search_box = driver.find_element(By.ID, "kw") search_box.send_keys("Selenium Chromedriver") search_box.send_keys(Keys.RETURN) # 等待页面加载完成 driver.implicitly_wait(10) finally: # 关闭浏览器 driver.quit() ``` ### 四、高级配置 为了增强 Selenium 的功能或兼容性,可以使用 `DesiredCapabilities` 和 `ChromeOptions` 进行更精细的配置[^3]。例如,在无头模式(Headless Mode)下运行 Chrome 浏览器: ```python from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options # 设置 Chrome 选项 chrome_options = Options() chrome_options.add_argument("--headless") # 无头模式 chrome_options.add_argument("--disable-gpu") # 禁用 GPU 加速 # 指定 ChromeDriver 路径 service = Service('/path/to/chromedriver') # 初始化 WebDriver driver = webdriver.Chrome(service=service, options=chrome_options) # 访问网页 driver.get("https://www.baidu.com") print(driver.title) # 关闭浏览器 driver.quit() ``` ### 五、常见问题及解决方法 1. **ChromeDriver 版本不匹配**:确保 ChromeDriver 的版本与本地 Chrome 浏览器版本一致[^4]。 2. **无法找到 ChromeDriver**:检查是否正确设置了 PATH 环境变量或是否在代码中指定了正确的路径。 3. **无头模式报错**:在某些系统上可能需要额外参数,例如 `--no-sandbox` 或 `--disable-dev-shm-usage`。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值