需求:
1:获取指定岗位的招聘信息
2:对公司地区,公司待遇,学历情况,工作经验进行简单分析并可视化展示
可视化分析:
公司地区:柱状图,地图
公司待遇:云图
公司-学历情况:饼图
公司工作经验:饼图
模块:
request:网络请求
re:正则匹配数据
pyecharts:可视化工具
自定义工具类:map_utils
温馨提示:由于pyecharts中的地图被禁用了,需要安装第三方地图包:安装方法-点这里
源码地址:https://github.com/lrq154439/crawl_web.git
爬取数据模块:
def get_info(name, page_num):
'''获取数据并统计'''
url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false' # url地址
# 请求头信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
'Host': 'www.lagou.com',
'Referer': 'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?labelWords=&fromSearch=true&suginput=',
'X-Anit-Forge-Code': '0',
'X-Anit-Forge-Token': 'None',
'X-Requested-With': 'XMLHttpRequest'
}