Scrapy服务简单使用

Scrapy

官网:Scrapy

安装

官网:Installation guide

官方推荐在虚拟环境安装

We strongly recommend that you install Scrapy in a dedicated virtualenv, to avoid conflicting with your system packages.
安装virtualenv,参考:python virtualenv简单使用

# 习惯用pip安装,conda用得少
bin/pip install scrapy

scrapy可运行文件在pip同级目录

简单使用

官网:Scrapy Tutorial

创建项目

bin/scrapy startproject tutorial

后续操作根据提示以及配合官方文档来进行。


Scrapyd和scrapyd-client

安装

官网:Scrapyd doc
Github:scrapy/scrapyd-client

# 也是在虚拟环境安装
bin/pip install scrapyd
bin/pip install scrapyd-client

scrapydscrapyd-deploy可运行文件在pip同级目录

配置Scrapyd服务

  1. 配置文件存在多个位置: Configuration file

  2. 如果是在虚拟环境中安装的,通过find -name scrapyd查到scrapyd文件夹的位置
    (我python版本是3.6,位置:lib/python3.6/site-packages/scrapyd),然后通过查看config.py文件来查看配置的读取逻辑

  3. 通过复制scrapyd/default_scrapyd.conf模板来配置即可

运行Scrapyd服务

这里不修改配置,直接运行可运行文件scrapyd

bin/scrapyd

浏览器打开:http://localhost:6800/

部署项目到服务器

官网:scrapyd-deploy

注意:scrapyd-deploy在虚拟环境的bin下

Windows下安装scrapyd-client会在pip同级目录下有个scrapyd-deploypy文件,需要复制到自己的项目下(scrapy.cfg同级目录),通过python scrapyd-deploy运行

查看使用说明

bin/scrapyd-deploy -h

进入自己的爬虫项目根目录(有scrapy.cfg文件那个)

修改scrapy.cfg文件,去掉url的注释

查看target(服务器)

bin/scrapyd-deploy -l

部署

bin/scrapyd-deploy <target> -p <project>
# or
bin/scrapyd-deploy

运行spider

官方:API

curl http://localhost:6800/schedule.json -d project=tutorial -d spider=quotes

查看结果:http://localhost:6800/jobs


issues

Windows 需要c++ 14来安装Twisted

  1. 下载Twisted的whl

https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

  1. pip install *.whl

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值