Scrapy-Redis并部署到gerapy实战之腾讯招聘

准备工作:
安装有minicoda3,scrapyd,redis和mongodb的Ubuntu虚拟机,主机安装有gerapy==0.9.12版本
第一部分:
代码
首先创建scrapy的一个项目。
spider里的代码如下:

from scrapy.http import HtmlResponse, Request
from scrapy_redis.spiders import RedisSpider


class JobSpider(RedisSpider):
    name = "job"
    redis_key = 'job:start_urls'

    def start_requests(self):
        start_url = 'https://careers.tencent.com/tencentcareer/api/post/Query?pageIndex=1&pageSize=10'
        self.server.lpush(self.redis_key, start_url)

        # 确保返回父类的生成器对象
        yield from super().start_requests()

    def parse(self, response: HtmlResponse, **kwargs):
        print("Parsing:", response.url)
        job_list = response.json()['Data']['Posts']
        for job in job_list:
            item = dict()
            item['RecruitPostName'] = job['RecruitPostName']
            item['Responsibility'] = job['Responsibility']
            item['RequireWorkYearsName'] = job['RequireWorkYearsName']

            yield item

        yield from self.next_page(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值