Selenium下载与安装

本文介绍如何使用Selenium自动化浏览器操作,包括安装配置、登录流程自动化及处理动态数据等内容。

selenium在python中的应用:
1.selenium可以完全模拟浏览器操作,对动态数据进行获取。动态数据由代码生成,在页面初始化的过程当中是没有的,也无法获取,但是可以通过selenium来获取。
2.有些数据是需要进行登录以后才能获取的,比如好友列表,评论,消费记录。。。登陆以后获取cookie才能进行以上的操作,但是使用selenium以后可以避免人工登录,只需要登录账号密码即可实现selenium代替登录。
一.打开终端,安装selenium:

pip install selenium

二.下载对应的驱动

火狐驱动:https://github.com/mozilla/geckodriver/releases/

谷歌驱动:http://chromedriver.storage.googleapis.com/index.html

下载解压后,将chromedriver.exe , geckodriver.exe , 移动到Python的安装目录,例如 D:\python\Anaconda\Scripts 。 然后再将Python的安装目录添加到系统环境变量的Path下面。
三.测试是否成功

打开pycharm,输入以下命令

启动谷歌浏览器

from selenium import webdriver

driver = webdriver.Firefox()

driver.get(‘http://www.baidu.com’)

driver.find_element_by_id(‘kw’).send_keys(‘selenium’)

启动火狐浏览器

from selenium import webdriver

driver = webdriver.Chrome()

driver.get(‘http://www.baidu.com’)

driver.find_element_by_id(‘kw’).send_keys(‘selenium’)

报错原因:selenium由网页驱动驱使浏览器进行操作,速度慢是一大特点。经常会出现代码执行完了,但是网页内容还没有加载完毕,里面的标签还没有显示出来,如果这时候操作里面的标签就会报出异常 NoSuchElementExpection
解决的方法:时间休眠 time.sleep()

缺点:不管页面的内容有没有加载完毕,一定要休眠够指定的秒数

启动谷歌浏览器

import time

from selenium import webdriver

driver = webdriver.Firefox()

driver.get(‘http://www.baidu.com’)

time.sleep(10)

driver.find_element_by_id(‘kw’).send_keys(‘selenium’)

启动火狐浏览器

import time

from selenium import webdriver

driver = webdriver.Chrome()

driver.get(‘http://www.baidu.com’)

time.sleep(10)

### Selenium WebDriver 的下载安装指南 Selenium WebDriver 是一种用于自动化浏览器操作的强大工具。以下是关于如何下载安装 Selenium WebDriver 的详细指南: #### 1. 环境准备 确保系统中已安装以下依赖项: - **Java 或 Python**:根据使用场景选择语言环境。如果使用 Java,则需要安装 Java 8 或更高版本[^1];如果使用 Python,则需先安装 Python 并将其添加到环境变量中[^3]。 - **IDE(可选)**:如 Eclipse(针对 Java)或 PyCharm(针对 Python)。对于 Java 用户,可以配置 Eclipse IDE[^1]。 #### 2. 下载安装 Selenium WebDriver 客户端 - **Java 用户**: - 下载 Selenium WebDriver Java 客户端,并将其添加到项目的依赖中[^1]。 - 如果使用 Maven 项目,可以在 `pom.xml` 文件中添加以下依赖项: ```xml <dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-java</artifactId> <version>4.0.0</version> </dependency> ``` - **Python 用户**: - 打开命令行工具,运行以下命令以安装 Selenium 库: ```bash pip install selenium ``` - 如果安装失败,可以尝试升级后再安装: ```bash pip install --upgrade pip pip install selenium ``` #### 3. 浏览器驱动程序的下载配置 Selenium WebDriver 需要特定浏览器的驱动程序才能控制浏览器。例如: - **ChromeDriver**(适用于 Google Chrome): - 根据 Chrome 浏览器的版本号,从官方页面下载对应版本的 ChromeDriver[^2]。 - 将解压后的 `chromedriver.exe` 文件路径添加到系统的 PATH 环境变量中。 - **GeckoDriver**(适用于 Firefox): - 从 Mozilla 官方页面下载 GeckoDriver[^2]。 - 同样将解压后的文件路径添加到 PATH 中。 #### 4. 示例代码 以下为 Python 和 Java 的简单示例代码,展示如何启动浏览器并访问指定 URL。 - **Python 示例**: ```python from selenium import webdriver # 初始化 Chrome 浏览器 driver = webdriver.Chrome(executable_path='path/to/chromedriver') # 最大化窗口 driver.maximize_window() # 访问百度首页 driver.get("https://www.baidu.com") ``` - **Java 示例**: ```java import org.openqa.selenium.WebDriver; import org.openqa.selenium.chrome.ChromeDriver; public class SeleniumDemo { public static void main(String[] args) { // 设置 ChromeDriver 路径 System.setProperty("webdriver.chrome.driver", "path/to/chromedriver"); // 初始化 Chrome 浏览器 WebDriver driver = new ChromeDriver(); // 最大化窗口 driver.manage().window().maximize(); // 访问百度首页 driver.get("https://www.baidu.com"); } } ``` #### 注意事项 - 确保浏览器驱动程序的版本浏览器版本匹配,否则可能导致兼容性问题[^2]。 - 如果未正确配置 PATH,可能会导致找不到驱动程序的错误。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值