Scrapy-Redis并部署到gerapy实战之腾讯招聘

江中新ZHN

已于 2024-06-03 14:36:08 修改

阅读量338

点赞数 5

分类专栏： scrapy 文章标签：学习笔记分布式 scrapy

于 2024-06-02 11:49:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2302_81214177/article/details/139388771

版权

准备工作：
安装有minicoda3，scrapyd，redis和mongodb的Ubuntu虚拟机，主机安装有gerapy==0.9.12版本
第一部分：
代码
首先创建scrapy的一个项目。
spider里的代码如下：

from scrapy.http import HtmlResponse, Request
from scrapy_redis.spiders import RedisSpider


class JobSpider(RedisSpider):
    name = "job"
    redis_key = 'job:start_urls'

    def start_requests(self):
        start_url = 'https://careers.tencent.com/tencentcareer/api/post/Query?pageIndex=1&pageSize=10'
        self.server.lpush(self.redis_key, start_url)

        # 确保返回父类的生成器对象
        yield from super().start_requests()

    def parse(self, response: HtmlResponse, **kwargs):
        print("Parsing:", response.url)
        job_list = response.json()['Data']['Posts']
        for job in job_list:
            item = dict()
            item['RecruitPostName'] = job['RecruitPostName']
            item['Responsibility'] = job['Responsibility']
            item['RequireWorkYearsName'] = job['RequireWorkYearsName']

            yield item

        yield from self.next_page(

最低0.47元/天解锁文章

博客等级

码龄2年

10
原创

202
点赞

269
收藏

197
粉丝

关注

私信

热门文章

分类专栏

scrapy 2篇
python基础 1篇

展开全部收起

最新评论

Scrapy-Redis原理和源码解析
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
07.Python中的协程学习笔记
优快云-Ada助手: 恭喜作者撰写了第7篇博客，标题为“Python中的协程学习笔记”，内容相信对读者们有很大的帮助。希望作者能够继续保持创作的热情和努力，为大家分享更多有价值的知识。下一步建议可以考虑深入研究Python中其他高级特性或者扩展到相关的技术领域，不断提升自己的技术水平，也让读者们得到更多启发和帮助。期待作者的下一篇作品！
04.异常文件处理与文件读取学习笔记
优快云-Ada助手: 恭喜您发布了第四篇博客！学习异常文件处理与文件读取是非常重要的，希望您能够继续保持创作的热情和耐心。下一步，可以尝试探讨一些实际案例，结合代码展示更多实践经验，相信会更具启发性。加油！期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
03.Python中的闭包与装饰器学习笔记
优快云-Ada助手: 恭喜用户写了第三篇博客，标题为“03.Python中的闭包与装饰器学习笔记”，看来你对Python的理解越来越深入了！希望你能继续保持创作的热情，不断学习、不断进步。下一步建议可以尝试深入探讨Python中其他高级特性，比如生成器、迭代器等，相信你会有更多收获的！期待你的下一篇作品！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Python中的面向对象编程学习笔记
优快云-Ada助手: 这是一篇很棒的博文！通过学习Python中的面向对象编程，你不仅能够掌握创建对象的方法，还能够理解类和对象之间的关系。除了类和对象的基本概念，我建议你在接下来的学习中深入了解继承、多态和封装等面向对象编程的高级概念。这些知识将帮助你更好地组织和设计你的代码，提高代码的可维护性和可重用性。继续努力，期待看到你更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。