数据可视化篇
思路:
1.画直方图分析,各个工资段人数分析;
2.画饼图分析,各工资占百分比分析;
有了数据后,可视化比较简单,一下是代码:
#初步统计,整理为直方图,方便观察
#设置直方图组距
avg_max = max(avg)
avg_min = min(avg)
#极差
avg_rg = avg_max - avg_min
#组距
avg_dst = avg_rg/50
#设置参数
avg_sty = npy.arange(avg_min,avg_max,avg_dst)
pyl.title("wages--count--assortment")
pyl.xlabel("wages")
pyl.ylabel("nmber")
pyl.hist(avg,avg_sty)
pyl.savefig("D:/python/爬虫/51job分析/hist-wages.png")
pyl.show()
'''------------画好直方图,可进行分析----------------------'''
#可画饼图分析,各个工资段的百分比
count1 = 0
count2 = 0
count3 = 0
count4 = 0
count5 = 0
count6 = 0
#对数据进行处理,以便来画饼图
for i in avg:
if float(i) < 5.0:
count1 += 1
if float(i) >= 5.0 and float(i) < 10.0:
count2 += 1
if float(i) >= 10.0 and float(i) < 20.0:
count3 += 1
if float(i) >= 20.0 and float(i) < 30.0:
count4 += 1
if float(i) >= 30.0 and float(i) < 40.0:
count5 += 1
if float(i) >= 40.0:
count6 += 1
#设置标签
labels = ['under-5k','5k-10k','10k-20k','20k-30k','30k-40k','over-40k']
#数据
count = [count1,count2,count3,count4,count5,count6]
#设置突出部分
expl = [0,0,0.1,0,0,0]
#设置饼图属性
fig = plt.figure(1, figsize=(6,6))
#autopct数据百分数,小数设置;shadow是否有阴影,labeldistance文字离饼图的距离
plt.pie(count,explode=expl,labels=labels,autopct='%1.2f%%',shadow=True,labeldistance=1.1)
plt.title("wages-count")
plt.savefig("D:/python/爬虫/51job分析/pie-wages.png")
plt.show()
代码比较简单,都是常规的设置。
以下是得到的分析图:
直方图:

饼图:

1123

被折叠的 条评论
为什么被折叠?



