Selenium下载与安装

本文介绍如何使用Selenium自动化浏览器操作,包括安装配置、登录流程自动化及处理动态数据等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

selenium在python中的应用:
1.selenium可以完全模拟浏览器操作,对动态数据进行获取。动态数据由代码生成,在页面初始化的过程当中是没有的,也无法获取,但是可以通过selenium来获取。
2.有些数据是需要进行登录以后才能获取的,比如好友列表,评论,消费记录。。。登陆以后获取cookie才能进行以上的操作,但是使用selenium以后可以避免人工登录,只需要登录账号密码即可实现selenium代替登录。
一.打开终端,安装selenium:

pip install selenium

二.下载对应的驱动

火狐驱动:https://github.com/mozilla/geckodriver/releases/

谷歌驱动:http://chromedriver.storage.googleapis.com/index.html

下载解压后,将chromedriver.exe , geckodriver.exe , 移动到Python的安装目录,例如 D:\python\Anaconda\Scripts 。 然后再将Python的安装目录添加到系统环境变量的Path下面。
三.测试是否成功

打开pycharm,输入以下命令

启动谷歌浏览器

from selenium import webdriver

driver = webdriver.Firefox()

driver.get(‘http://www.baidu.com’)

driver.find_element_by_id(‘kw’).send_keys(‘selenium’)

启动火狐浏览器

from selenium import webdriver

driver = webdriver.Chrome()

driver.get(‘http://www.baidu.com’)

driver.find_element_by_id(‘kw’).send_keys(‘selenium’)

报错原因:selenium由网页驱动驱使浏览器进行操作,速度慢是一大特点。经常会出现代码执行完了,但是网页内容还没有加载完毕,里面的标签还没有显示出来,如果这时候操作里面的标签就会报出异常 NoSuchElementExpection
解决的方法:时间休眠 time.sleep()

缺点:不管页面的内容有没有加载完毕,一定要休眠够指定的秒数

启动谷歌浏览器

import time

from selenium import webdriver

driver = webdriver.Firefox()

driver.get(‘http://www.baidu.com’)

time.sleep(10)

driver.find_element_by_id(‘kw’).send_keys(‘selenium’)

启动火狐浏览器

import time

from selenium import webdriver

driver = webdriver.Chrome()

driver.get(‘http://www.baidu.com’)

time.sleep(10)

### 如何下载安装 Selenium #### Python 中的 Selenium 下载安装 对于希望在 Python 环境下使用 Selenium 的开发者来说,可以通过 pip 工具来简化这一过程。确保已安装 Python 和 pip 后,在命令行工具中输入如下指令完成 Selenium 库的安装[^2]: ```bash pip install selenium ``` 安装完成后可通过 `pip list` 查看当前环境中所有已安装库及其版本号以确认 Selenium 是否成功安装。 #### WebDriver 的获取 为了使 Selenium 能够控制不同类型的浏览器执行自动化测试任务,还需要额外准备对应的 WebDriver 文件。WebDriver 是一种协议,允许脚本语言(如 Python)通过特定驱动程序操作 Web 浏览器。针对 Chrome、Firefox 或 Opera 等主流浏览器,官方提供了相应的 WebDriver 版本供用户下载[^4]。 - **ChromeDriver**: 访问镜像站点 [Taobao Mirrors](https://npm.taobao.org/mirrors/chromedriver/) 获取适用于本地 Chrome 浏览器版本的 ChromeDriver; - **GeckoDriver (for Firefox)**: 对应于 Mozilla Firefox 的 GeckoDriver 则可以从相同位置找到适配版本; - **OperaDriver**: 类似地,如果目标是 Opera,则前往相应链接寻找匹配版本。 注意保持所选 WebDriver 其对应浏览器版本之间的兼容性非常重要,这通常意味着两者应当尽可能接近甚至完全一致。有关具体映射关系可以参阅相关技术博客提供的最新指南。 #### 设置环境变量 下载并解压缩得到的 WebDriver 文件之后,建议将其放置在一个容易访问的位置并将该路径添加到系统的 PATH 环境变量里去。这样做可以让操作系统知道在哪里查找这些必要的二进制文件而无需每次都指定完整的路径名。 #### 使用示例 当一切配置妥当时便可以在 Python 编程环境下轻松导入并利用 Selenium 进行网页交互了。下面给出一段简单的例子用于验证设置是否正确无误: ```python from selenium import webdriver browser = webdriver.Chrome() # 如果使用的是其他浏览器,请替换为对应的webdriver对象创建语句 try: browser.get('http://www.example.com') finally: browser.quit() ``` 这段代码会启动默认关联的 Chromium 浏览器实例加载给定网址页面,并最终关闭它。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值