scrapyd部署scrapy

本文详细介绍了如何使用Scrapyd部署Scrapy爬虫项目,包括在Centos7.2服务器上安装配置Scrapyd,以及在Mac客户端安装scrapyd-client,通过json请求操作实现爬虫项目的远程部署和运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

部署scrapy可以使用scrapyd,通过在客户端安装scrapyd-client,服务端安装scrapyd,可以使用命令将scrapy推到服务器上进行爬虫,对服务器端不需要过多的配置,只需要保证1.scrapyd处于运行状态,2.scrapy需要的模块全部安装

服务端操作(Centos7.2服务器)

  1. 通过命令pip3 install scrapyd安装,由于pip会将模块自动安装到python下
  2. 进入目录/usr/local/python3.5.2/lib/python3.5/site-packages/scrapyd
  3. 修改配置default_scrapyd.conf
[scrapyd]
eggs_dir    = eggs
logs_dir    = logs
items_dir   =
jobs_to_keep = 5
dbs_dir     = dbs
max_proc    = 0
max_proc_per_cpu = 4
finished_to_keep = 100
poll_interval = 5.0
bind_address = 0.0.0.0  #允许远程访问
http_port   = 6800
debug       = off
runner      = scrapyd.runner
application = scrapyd.app.application
launcher    = scrapyd.launcher.Launcher
webroot     = scrapyd.website.Root
[services]
schedule.json     = scrapyd.webservice.Schedule
cancel.json       = scrapyd.webservice.Cancel
addversion.json   = scrapyd.webservice.AddVersion
listprojects.json = scrapyd.webservice.ListProjects

保存之后就可以启动scrapyd

  1. 进入目录/usr/local/python3.5.2/bin
  2. 使用命令 setsid scrapyd以后台的模式启动scrapyd,到此,服务端就配置好了。

客户端操作(Mac开发机)

  1. 此时通过客户端浏览器访问0.0.0.0:6800应该是可以访问到爬虫的可视化界面的
  2. 直接通过pip3 install scrapyd-client安装
  3. 修改要上传的scrapy项目,修改scrapy.cfg,首先去掉url前面的注释符号,url是scrapyd服务器的网址
  4. 然后project=tenCent为项目名称,可以随意起名
    效果如下:


    3806154-8af0c21d68dd65a7.png
    image.png

    接下来就是一系列的json请求操作了

scrapyd-deploy <target> -p <project>  --version <version>

Target:deploy后面的名称。可以为空
Project:自行定义名称,跟爬虫的工程名字无关。
Version:自定义版本号,不写的话默认为当前时间戳。

curl http://localhost:6800/schedule.json -d project=myproject -d spider=spider_name

创建运行爬虫任务

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值