拉勾网`Python职位`分析

本文基于拉勾网爬取的Python职位数据进行分析,涵盖了数据清洗、职位大类别统计、实习与全职职位比例、公司分布及数据开发、人工智能、后端开发、测试等具体职位的详细情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在前面一篇文章—拉勾网职位数据爬取,我爬取了拉勾网在杭州Python职位应届生这三个条件下的所有数据。下面我对这些数据做一下分析。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
%matplotlib inline

#配置中文字体和修改字体大小
matplotlib.rcParams['font.family'] = 'SimHei'
matplotlib.rcParams['font.size'] = 30
df = pd.read_csv("Python-School-Hangzhou.csv",encoding = 'utf-8')

数据清洗

df.columns.values.tolist()

    ['adWord',
     'appShow',
     'approve',
     'businessZones',
     'city',
     'companyFullName',
     'companyId',
     'companyLabelList',
     'companyLogo',
     'companyShortName',
     'companySize',
     'createTime',
     'deliver',
     'district',
     'education',
     'explain',
     'financeStage',
     'firstType',
     'formatCreateTime',
     'gradeDescription',
     'hitags',
     'imState',
     'industryField',
     'industryLables',
     'isSchoolJob',
     'jobNature',
     'lastLogin',
     'latitude',
     'linestaion',
     'longitude',
     'pcShow',
     'plus',
     'positionAdvantage',
     'positionId',
     'positionLables',
     'positionName',
     'promotionScoreExplain',
     'publisherId',
     'resumeProcessDay',
     'resumeProcessRate',
     'salary',
     'score',
     'secondType',
     'stationname',
     'subwayline',
     'workYear']
原始数据有太多的无用信息,下面进行数据清洗。
df.drop(['adWord','appShow','approve'],axis = 1,inplace = True)
df.drop(['businessZones','companyLabelList','companyLogo'],axis = 1,inplace = True)
df.drop(['createTime','deliver','district','education','explain'],axis = 1,inplace = True)
df.drop(['formatCreateTime','gradeDescription','hitags'],axis = 1,inplace = True)
df.drop(['imState','industryLables'],axis = 1,inplace = True)
df.drop(['isSchoolJob'],axis = 1,inplace = True)
df.drop(['lastLogin','promotionScoreExplain','publisherId','resumeProcessDay','resumeProcessRate','stationname','subwayline'],axis = 1,inplace = True)
df.drop(['pcShow','plus','positionAdvantage','positionId','positionLables','score'],axis = 1,inplace = True)
df.drop(['latitude','linestaion','longitude'],axis = 1,inplace = True)
df.drop(['city','companyFullName'],axis = 1,inplace = True)
df.drop(['companyId','firstType'],axis = 1,inplace = True)

数据分析

下面根据我想要的信息做一下数据处理、分析。

职位大类别统计

secondType_Series = df['secondType'].value_counts()
secondType_Series
数据开发      29
后端开发      28
人工智能      23
测试        21
运维        14
移动前端开发    10
数据分析       6
企业软件       6
硬件开发       2
产品经理       2
风控         1
Name: secondType, dtype: int64

下面用Pandas画一下直方图。

plt.figure(figsize=(10,5))
secondType_Series.plot.bar()
plt.show()

这里写图片描述

实习、全职统计

jobNature_Series = df['jobNature'].value_counts()
jobNature_Series
实习    76
全职    66
Name: jobNature, dtype: int64

公司统计

统计每个公司出现的个数,然后选取招聘Python相关职位个数大于等于3的公司。

companyShortName_Series = df['companyShortName'].value_counts()
companyShortName_Series_3 = companyShortName_Series[companyShortName_Series > 2] # 选取招聘Python相关职位个数大于等于3的公司
companyShortName_Series_3
个推            10
大搜车            8
同花顺            7
一周CP           4
袋鼠云            4
元素链            4
网易游戏           4
谷神星            4
美国道富           3
网易             3
点我达            3
阿里巴巴-B类事业群     3
Name: companyShortName, dtype: int64

下面用Pandas画一下直方图。

plt.figure(figsize=(10,5))
companyShortName_Series_3.plot.bar()
plt.show()

这里写图片描述

具体职位

数据开发

下面我具体看下“数据开发”对应的职位。

dba = df.loc[df['secondType'] == '数据开发']
dba
companyShortNamecompanySizefinanceStageindustryFieldjobNaturepositionNamesalarysecondTypeworkYear
4个推150-500人D轮及以上移动互联网全职数据研发工程师(校招)10k-15k数据开发应届毕业生
14美丽联合集团500-2000人D轮及以上电子商务全职大数据开发工程师15k-20k数据开发应届毕业生
15个推150-500人D轮及以上移动互联网全职​数据开发工程师(校招岗位)10k-15k数据开发应届毕业生
19美国道富2000人以上上市公司金融实习数据分析(数据挖掘)实习生3k-4k数据开发不限
23乐刻运动500-2000人C轮O2O全职算法实习生3k-5k数据开发应届毕业生
27SensOmics50-150人未融资企业服务,硬件全职生物信息学工程师10k-20k数据开发应届毕业生
33网易游戏2000人以上上市公司游戏实习数据挖掘实习生-杭州2k-3k数据开发不限
34Club Factory150-500人C轮电子商务,移动互联网全职数据分析师8k-15k数据开发应届毕业生
39袋鼠云150-500人A轮数据服务实习大数据开发实习生4k-6k数据开发应届毕业生
40安恒信息500-2000人D轮及以上信息安全 ,数据服务实习数据解析工程师(实习)3k-5k数据开发应届毕业生
42大搜车2000人以上D轮及以上移动互联网,O2O实习数据开发实习生2k-3k数据开发应届毕业生
44览众数据50-150人B轮电子商务,数据服务实习建模工程师实习生3k-5k数据开发应届毕业生
47网易游戏2000人以上上市公司游戏实习爬虫工程师(实习生)3k-4k数据开发不限
52数美150-500人B轮企业服务,数据服务实习机器学习(校招/实习)4k-8k数据开发应届毕业生
67大搜车2000人以上D轮及以上移动互联网,O2O实习量化研究实习生10-03-012k-4k数据开发应届毕业生
69数美150-500人B轮企业服务,数据服务全职机器学习(实习/校招)4k-8k数据开发应届毕业生
78美丽联合集团500-2000人D轮及以上电子商务实习数据仓库开发实习生2k-3k数据开发应届毕业生
80壹宝50-150人A轮移动互联网,医疗健康实习数据开发实习生3k-5k数据开发不限
97TELETRAAN15-50人天使轮数据服务,企业服务实习实习生2k-4k数据开发应届毕业生
99河象15-50人不需要融资教育,移动互联网实习实习机器学习工程师2k-4k数据开发应届毕业生
100淳毅资产少于15人未融资金融实习量化算法工程师3k-5k数据开发应届毕业生
107中软安人150-500人未融资电子商务,企业服务实习大数据开发实习生5k-8k数据开发应届毕业生
108贝安云50-150人未融资移动互联网,医疗健康全职数据挖掘工程师10k-18k数据开发应届毕业生
128稻芒数据少于15人未融资数据服务实习数据专员兼职实习3k-6k数据开发应届毕业生
131网易2000人以上上市公司电子商务,移动互联网实习数据挖掘实习生4k-6k数据开发不限
134个推150-500人D轮及以上移动互联网全职​数据建模工程师(校招岗位)10k-15k数据开发应届毕业生
135个推150-500人D轮及以上移动互联网全职数据建模工程师10k-15k数据开发应届毕业生
137个推150-500人D轮及以上移动互联网全职数据分析师(校招岗位)10k-15k数据开发应届毕业生
138大搜车2000人以上D轮及以上移动互联网,O2O实习风险建模实习生10-01-012k-4k数据开发应届毕业生
人工智能

下面看下“人工智能”对应的职位。

ai = df.loc[df['secondType'] == '人工智能']
ai
companyShortNamecompanySizefinanceStageindustryFieldjobNaturepositionNamesalarysecondTypeworkYear
26图普科技(深度学习图像识别云)50-150人A轮移动互联网,数据服务全职00069-深度学习工程师(校招)13k-23k人工智能应届毕业生
41翼米网络少于15人天使轮移动互联网 社交网络实习算法工程师3K-6K人工智能不限
43城市大数据50-150人未融资移动互联网实习算法实习生3k-4k人工智能应届毕业生
48袋鼠云150-500人A轮数据服务实习算法实习生(杭州)5k-6k人工智能应届毕业生
50亿咖通科技500-2000人不需要融资移动互联网,硬件实习增强学习算法实习生3k-5k人工智能不限
54点我达500-2000人D轮及以上O2O全职2019届校招-风控建模12k-20k人工智能应届毕业生
55中科视拓50-150人A轮企业服务实习算法实习工程师3k-5k人工智能应届毕业生
63点我达500-2000人D轮及以上O2O全职2019届校招-算法20k-40k人工智能应届毕业生
65Obsbot寻影15-50人天使轮硬件,其他实习深度学习算法实习生4k-8k人工智能应届毕业生
70灵西智能15-50人天使轮企业服务,硬件实习运动规划算法实习岗3k-5k人工智能不限
82虹软500-2000人不需要融资移动互联网,信息安全全职计算机视觉算法工程师(2019应届生)15k-30k人工智能应届毕业生
83Obsbot寻影15-50人天使轮硬件,其他实习深度学习算法工程师12k-16k人工智能应届毕业生
87杭州智团15-50人不需要融资医疗健康全职人工智能实习生3k-6k人工智能应届毕业生
89杭州默安科技有限公司50-150人A轮信息安全全职机器学习算法实习生4k-6k人工智能应届毕业生
92智慧视通50-150人天使轮数据服务,人工智能实习视频图像算法工程师(实习岗)3k-5k人工智能不限
94零零无限50-150人A轮硬件实习计算机视觉算法实习生3k-4k人工智能应届毕业生
106零零无限50-150人A轮硬件实习机器学习算法实习生3k-4k人工智能应届毕业生
113东信软件150-500人上市公司移动互联网,数据服务实习人工智能-实习生2k-4k人工智能应届毕业生
116昇星网络15-50人天使轮其他,移动互联网实习计算机视觉、机器学习、深度学习的实习生4k-8k人工智能不限
117eyecloud15-50人天使轮移动互联网,其他实习图像算法实习生3k-6k人工智能应届毕业生
118虹软500-2000人不需要融资移动互联网,信息安全全职机器学习算法工程师(2019应届生)15k-30k人工智能应届毕业生
130网易2000人以上上市公司电子商务,移动互联网实习人工智能实习生6k-8k人工智能不限
141大搜车2000人以上D轮及以上移动互联网,O2O全职算法实习生 07-01-324k-5k人工智能应届毕业生
后端开发

下面看下“后端开发”对应的职位。

rd = df.loc[df['secondType'] == '后端开发']
rd
companyShortNamecompanySizefinanceStageindustryFieldjobNaturepositionNamesalarysecondTypeworkYear
0Eigen50-150人A轮移动互联网,数据服务全职Python开发工程师10k-20k后端开发应届毕业生
1大搜车2000人以上D轮及以上移动互联网,O2O实习Python实习生07-01-564k-5k后端开发应届毕业生
2安恒信息500-2000人D轮及以上信息安全 ,数据服务全职c++研发实习生(漏洞扫描引擎方向)2k-4k后端开发应届毕业生
3Club Factory150-500人C轮电子商务,移动互联网全职后端工程师8k-15k后端开发应届毕业生
5电魂网络500-2000人上市公司游戏实习服务器/客户端开发工程师8k-11k后端开发不限
7天猫2000人以上上市公司移动互联网,电子商务全职研发工程师12k-20k后端开发应届毕业生
9同花顺2000人以上上市公司金融全职算法工程师15k-25k后端开发应届毕业生
10齐治科技50-150人不需要融资信息安全全职软件开发工程师10k-15k后端开发应届毕业生
12网易游戏2000人以上上市公司游戏实习Unity3D开发实习生-杭州3k-4k后端开发不限
17数澜科技150-500人A轮企业服务,数据服务实习Node.js实习生【杭州】3k-5k后端开发应届毕业生
21智慧视通50-150人天使轮数据服务,人工智能实习C++工程师(实习生)3k-5k后端开发应届毕业生
28同花顺2000人以上上市公司金融全职C++开发工程师(主服务端)7k-14k后端开发应届毕业生
30个推150-500人D轮及以上移动互联网全职Node.js开发工程师(校招岗位)10k-15k后端开发应届毕业生
32一周CP15-50人A轮移动互联网,社交网络实习后端工程师-实习6k-12k后端开发应届毕业生
36溯博链鑫区块链15-50人不需要融资移动互联网全职go 开发工程师10k-20k后端开发应届毕业生
45个推150-500人D轮及以上移动互联网实习Java/机器学习方向实习生3k-5k后端开发不限
49一周CP15-50人A轮移动互联网,社交网络实习一周工程师-校招6k-12k后端开发应届毕业生
58阿里巴巴-B类事业群2000人以上上市公司移动互联网,电子商务全职资深c++开发工程师30k-40k后端开发应届毕业生
73阿里巴巴-B类事业群2000人以上上市公司移动互联网,电子商务全职算法专家30k-40k后端开发应届毕业生
75袋鼠云150-500人A轮数据服务实习Java开发实习生3k-4k后端开发应届毕业生
77数梦工场500-2000人A轮移动互联网,数据服务实习云服务工程师实习生3k-5k后端开发应届毕业生
85阿里巴巴-B类事业群2000人以上上市公司移动互联网,电子商务全职C++技术专家30k-40k后端开发应届毕业生
86蚂蚁金服集团2000人以上B轮金融,移动互联网实习【支付宝.实习】Java开发工程师6k-9k后端开发应届毕业生
90蚂蚁金服集团2000人以上B轮金融,移动互联网实习【实习生.支付宝】研发工程师JAVA7k-10k后端开发应届毕业生
102心景科技15-50人天使轮游戏全职自然语言处理工程师20k-30k后端开发应届毕业生
121翼米网络少于15人天使轮移动互联网 社交网络实习风控算法工程师4K-6K后端开发不限
129谷神星50-150人A轮信息安全,移动互联网全职软件开发(实习)4k-5k后端开发应届毕业生
133个推150-500人D轮及以上移动互联网全职Node.js开发实习生5k-8k后端开发应届毕业生
测试

下面看下“测试”对应的职位。

qa = df.loc[df['secondType'] == '测试']
qa
companyShortNamecompanySizefinanceStageindustryFieldjobNaturepositionNamesalarysecondTypeworkYear
6有赞500-2000人上市公司移动互联网,企业服务全职[2019校招]测试开发工程师10k-18k测试应届毕业生
8菜鸟网络2000人以上B轮电子商务全职测试开发工程师15k-20k测试应届毕业生
13亿方云科技150-500人B轮移动互联网,数据服务实习I02006 测试工程师实习生-杭州3k-4k测试应届毕业生
29Face++500-2000人C轮移动互联网,硬件实习测试实习生2k-4k测试应届毕业生
37元素链50-150人C轮金融 移动互联网全职资深测试开发工程师12k-24k测试应届毕业生
51为简科技150-500人不需要融资移动互联网,电子商务全职初级测试工程师双休4k-8k测试应届毕业生
72同花顺2000人以上上市公司移动互联网,金融全职软件测试工程师5k-10k测试应届毕业生
74浙江核新同花顺网络信息股份有限公司2000人以上上市公司金融全职测试9k-18k测试应届毕业生
76大搜车2000人以上D轮及以上移动互联网,O2O实习测试实习生 07-01-194k-5k测试应届毕业生
88浙江泰源50-150人不需要融资移动互联网 硬件全职测试工程师4K-6K测试应届毕业生
93贝连50-150人不需要融资移动互联网,金融实习测试实习生2k-3k测试不限
96同花顺2000人以上上市公司移动互联网,金融全职金融软件测试8k-15k测试应届毕业生
98点我达500-2000人D轮及以上O2O全职2019届校招-测试开发15k-25k测试应届毕业生
104南昌鎏彩科技有限公司150-500人不需要融资移动互联网,人工智能全职测试实习生双休4k-8k测试应届毕业生
109同花顺2000人以上上市公司移动互联网,金融全职自动化测试工程师12k-18k测试应届毕业生
110数梦工场500-2000人A轮移动互联网,数据服务实习测试工程师实习生3k-5k测试应届毕业生
111宇为科技15-50人天使轮数据服务,移动互联网全职软件测试10k-15k测试应届毕业生
112慧码科技50-150人未融资移动互联网全职测试实习生4k-6k测试应届毕业生
114浙江核新同花顺网络信息股份有限公司2000人以上上市公司金融全职测试工程师9k-15k测试应届毕业生
122元素链50-150人C轮金融 移动互联网全职测试工程师12k-24k测试应届毕业生
126贝贝网500-2000人D轮及以上电子商务实习测试实习生(19届及以后毕业)4k-5k测试不限
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值