完成:
1.爬取信息
2.基于爬取结果筛选符合条件的信息
岗位名称、薪资、岗位要求、地区、公司名称、公司规模、细节链接
3.筛选base杭州的岗位保存到csv文件中
"""
[课 题]: Python爬取boss直聘
[开发环境]:
python 3.8
pycharm 专业版
selenium3.141.0
代码编写思路
1. 打开一个浏览器
2. 打开一个网址
3. 获取数据
4. 保存数据
"""
from selenium import webdriver # 操作浏览器的类
import csv
f = open('boss-杭州.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.writer(f)
csv_writer.writerow(['岗位名称', '薪资待遇', '岗位详情', '岗位地区', '公司福利', '公司名称', '公司规模', '岗位需要技能', '岗位详情链接'])
# 1. 打开一个浏览器
driver = webdriver.Edge()#Edge浏览器
# driver = webdriver.Chrome()#谷歌浏览器
for page in range(1, 11):
# 2. 打开一个网址
driver.get(r'https://www.zhipin.com/web/geek/job?query=数据分析&city=100010000&page='+str(page))
# 等待10秒
driver.implicitly_wait(10)
# 3. 获取数据 定位数据
# 获取到所有的商品信息,selector定位关键信息所在区域:.job-card-wrapper,复制选项可以定位到具体标签
lis = driver.find_elements_by_css_selector('.job-card-wrapper')
# 二次提取岗位具体信息,将位于杭州的岗位保存在csv中
for li i

该代码示例使用Python3.8和Selenium3.141.0爬取Boss直聘网站上的数据分析岗位信息,针对杭州地区的职位,筛选出岗位名称、薪资、要求等详细信息,并保存到CSV文件中。程序会打开Edge或Chrome浏览器,访问特定URL,抓取每个职位的多个属性,并在遇到网络不稳定导致的元素定位问题时仍能进行小范围爬取。
最低0.47元/天 解锁文章
2782





