爬虫之selenium(二)

本文介绍了selenium的导入和基本使用方法,包括打开浏览器、定位网页元素和获取数据的Xpath。通过实例展示了如何使用selenium进行网页爬取。

上期文章我们介绍了selenium的下载和安装,本期我们来介绍selenium的使用

selenium的基本使用:

1.selenium的导入:

selenium的导入很简单

from selenium.webdriver import Chrome
web = Chrome()

这个几乎就是一个思维定势了,以后再讲selenium或是拿他实战时特别常用,建议大家背下来

然后我们就来找到受害者也就是我们想要爬取的网站网址

完善代码:

from selenium.webdriver import Chrome
web = Chrome()
web.get('你要爬的网站网址')

ok,这时候我们简单运行一下就能看见你有另一个浏览器启动了并跳转到了那个网址

接下来我们爬取我们想要的数据,鼠标右键,选择检查

这时候我们可以看出来弹出了一个黑框,选择其中的Elements

 

 

 可以看到黑框的最左上角有一个小箭头的标志

### 使用 Selenium 实现 Python 爬虫自动登录 为了实现使用 Selenium 进行 Python 爬虫自动登录的功能,可以按照如下方法编写代码: #### 导入必要的模块并初始化 WebDriver 首先需要导入 `webdriver` 模块来控制浏览器行为。 ```python from selenium import webdriver # 从selenium导入webdriver [^2] ``` 接着设置 Chrome 浏览器驱动路径,并创建一个新的浏览器实例。 ```python driver_path = 'path/to/chromedriver' # 需要替换为实际 chromedriver 路径 browser = webdriver.Chrome(executable_path=driver_path) ``` #### 访问目标网页并输入用户名密码 打开指定的目标网址,在页面加载完成后找到对应的表单元素填充账号信息。 ```python login_url = "https://example.com/login" browser.get(login_url) username_input = browser.find_element_by_name('username') password_input = browser.find_element_by_name('password') username_input.send_keys('your_username') # 替换成自己的用户名 password_input.send_keys('your_password') # 替换成自己的密码 ``` #### 提交表单完成登录动作 定位到提交按钮点击它以触发登录请求。 ```python submit_button = browser.find_element_by_css_selector('.btn-login') # 假设类名为 .btn-login 的按钮是提交按钮 submit_button.click() ``` 以上就是利用 Selenium 库让 Python 程序模仿人类操作浏览器的过程[^1]。需要注意的是不同网站的具体结构可能有所差异,因此上述代码中的选择器表达式应当依据实际情况调整。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值