一、实现目标
获取实习僧网站上不同城市招聘信息的职位名称、公司名称、工作地址和工作薪资信息。
二、实现步骤
2.1 网页分析
想要爬取数据,首先要去网页的 HTML 代码中找到所在的位置。在 Google Chrome 浏览器中复制粘贴下面的链接。https://www.shixiseng.com。在搜索栏内输入【产品经理】
使用鼠标定位法,以第一个职位信息为例,在 HTML 代码中我们会发现,职位名称、公司名称和工作地址所在的节点中,class 的属性值中都有 ellipsis。ellipsis 的意思是省略,也就是说在页面中展示的不是完整招聘信息,只是简化后的信息。
想要获得完整的信息,我们需要进入职们的详细页面进行分析,在详细页面中,各节点中的 class 属性值和标