【Python Selenium】爬取某boss当地职位信息

本文介绍了如何使用Python的Selenium库绕过反爬机制,爬取BOSS直聘上的岗位名称、薪资、地区、学历要求和公司信息。虽然效率较低,但相比手动操作仍大幅提高效率。首先导入所需模块,设置User Agent和代理,然后编写函数获取每个页面的HTML并存储。最后,利用PyQuery解析HTML,提取关键信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

不得不说现在的招聘网站反爬做的相当出色,不过利用自动化处理模块selenium依然可以实现工作岗位信息的爬取,尽管爬取效率较低,不过相对人工手动数据依然非常高效。

首先来明确我们要爬取的信息。

  1. 岗位名称
  2. 岗位薪资
  3. 岗位地区
  4. 学历要求
  5. 公司名称
  6. 公司标签

当然如果想爬取更多信息也可以自行进行选择。

首先import模块

from selenium import webdriver 
import time 
import random
from lxml import etree 

user agent设置不赘述,可以参考前面文章。

这里注意一下代理的设置,具体代理ip和端口自行上网查找即可,有很多免费试用。

proxies = [
'--proxy-server=http://218.104.255.4:16939',
'--proxy-server=http://113.236.141.251:25734',
'--proxy-server=http://60.182.187.83:44565',
'--proxy-server=http://182.38.126.56:19933',
'--proxy-server=http://182.34.148.247:15763',
]
proxy = random.c
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值