用Python爬取各大网站招聘平台，终于让我给知道对口的工作

最新推荐文章于 2020-12-17 12:21:07 发布

原创最新推荐文章于 2020-12-17 12:21:07 发布 · 262 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Python学习教程专栏收录该内容

117 篇文章

订阅专栏

本文分享了一个年轻人在职场初期因盲目跳槽导致的“低不成，高不就”困境，及如何通过调整心态和策略找到满意工作的经验。

个人经历：低不成，高不就

依稀还记得15年刚出来工作那会，在第一个互联网公司实习，在公司听惯了身边人说公司这不好，那不好，作为新人的我深受影响，不知从何时开始就想快点结束实习期换一份更好的工作；

千盼万盼，终于迎来第二年的毕业，毕业后我也选择了大部分实习生的选择，没有再回到公司，在之后，懵懂的我终于迎来人生的第一次打击，在之后的两个月的时间，我开始在做比较，结果没有找到一家比上家更好的工作，由于当初的不辞而别，我也感觉没脸回到上家公司，终于到了身无分文的地步，而我也不得以选择一家“差”的公司，想着做几个月存点钱再去找一份更好的工作；

这样的恶性循环在我身上循环了一年，“低不成，高不就”的现象也许不只是出现在我身上，下面教你如果找到一份自己相对满意的工作！

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

正文：找一份自己满意的工作

拿一个招聘网站用来分析：

1、分析网站结构，确定我们要抓取的数据内容

通过 Chrome 浏览器右键检查查看 network 并对网站结构进行分析发现我们在 ajax 请求界面中，可以看到这些返回的数据正是网站页面中Python岗位招聘的详情信息。

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

之后我们在查看headers的时候发现该网站请求的方式是Post请求，也就是说在请求的过程中需要携带Form Data数据

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

在多次对网页界面进行分析评测的时候，发现在点击第二页的时候Form Data的携带格式发生了变化。可以看到 pn=2 肯定是咱们的当前的页数。

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

2、不管三七二十一，先请求拿到数据在说

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

在直接请求界面的时候我们发现网站有反爬机制，不让我们请求《“msg”:“您操作太频繁,请稍后再访问”》，我们携带请求头伪装一下，不行

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

这里我用了一种可以快速生成headers以及cookie的工具：

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

我怀疑该网站具有多重反爬策略，当我在次添加cookies试一下的时候；我们发现数据可以正常获取了；难道就这么简单就解决拉勾网数据获取的问题了吗？然而机智的我察觉到事情并没有想像的那么简单；

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

我的最终解决方案是共用 session，就是说我们在每次请求界面的时候先获取session然后原地更新我们的session之后在进行数据的抓取，最后拿到想要的数据。

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

第二步：对数据进行分解

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

运行结果：

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

第三步：对解析数据进行存储

这里通过 excel 表格的形式进行存储；

需要 pip install xlwt 安装一下 xlwt 库.

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

最终显示数据内容

用Python爬取各大网站招聘平台，终于让我给知道对口的工作

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。