Python Scrapy 爬虫小教程1：爬取智联招聘java工程师招聘信息

最新推荐文章于 2025-06-16 17:46:02 发布

置顶 markron先生

最新推荐文章于 2025-06-16 17:46:02 发布

阅读量596

点赞数 1

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/qq_36371594/article/details/89847474

javaweb 同时被 3 个专栏收录

13 篇文章

订阅专栏

python

5 篇文章

订阅专栏

pycharm

4 篇文章

订阅专栏

本文介绍使用Scrapy爬取智联招聘Java工程师招聘信息的过程。首先创建Scrapy项目，通过Anaconda Prompt输入代码完成创建，接着在Pycharm中导入项目，在spider下新建spiderexample.py文件，最后在Anaconda Prompt选定项目运行，实现爬取。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Scrapy爬取智联招聘java工程师招聘信息
爬取此页面的招聘信息：
在这里插入图片描述

***************************点击此处直达原网页

创建一个scrapy 项目：
打开Anaconda Prompt
在这里插入图片描述
输入代码：

scrapy startproject crapyDemo

enter:
在这里插入图片描述

创建成功！
打开Pycharm:
file->open:
找到你创建的crapyDemo的位置，点击OK导入,在spider下新建spiderexample.py文件。
在这里插入图片描述
spiderexample.py代码：

import scrapy

class SpiderexampleSpider(scrapy.Spider):
    name = 'spiderexample'

    start_urls = ['https://m.zhaopin.com/sou/undefined--?keyword=java&provinceCode=undefined&city=undefined']

    def parse(self, response):
        detailxpath='//div[@class="title-info"]';
        items=response.xpath(detailxpath);
        for item in items:
            job=item.xpath('./div/text()').extract_first();
            jobsal=item.xpath('./div[2]/div[1]/text()').extract_first();
            if job is not None:
                print("职位："+job+"----工资："+jobsal)

打开Anaconda Prompt，选定你创建的项目scrapyDemo