Scrapy命令行工具

配置文件

1、/etc/scrapy.cfg or c:\scrapy\scrapy.cfg (system-wide),
2、~/.config/scrapy.cfg ($XDG_CONFIG_HOME) and ~/.scrapy.cfg ($HOME) for global settings(user-wide)
3、scrapy.cfg inside a scrapy project’s root (project-wide).

优先级:project-wide > user-wide > system-wide

常见命令

一些命令在项目内项目外运行有一些差别。命令可以分为全局命令(Global commands)和只能在项目里使用的命令(Project-only commands)

Global commands

scrapy startproject

scrapy startproject <project_name> [project_dir]
# 在project_dir目录下创建一个project_name的项目,如果project_dir未指定,则proejct_dir默认和project_dir系统
# 例:scrapy startproject myproject

scrapy genspider

scrapy genspider [-t template] <name> <domain>
# 使用模板生成一个爬虫,
# -t:指定模板,否则使用默认模板
# name:爬虫的名字
# domain:爬取的域名
# 例:scrapy genspider example example.com

scrapy settings

scrapy settings [options]
# 获取scrapy的设置
# 例:scrapy settings --get BOT_NAME

scrapy runspider

scrapy runspider <spider_file.py>
# 直接运行一个爬虫文件
# 例:scrapy runspider myspider.py

scrapy shell

scrapy shell [url]
# 开启scrapy shell
# 例:scrapy shell http://www.example.com/some/page.html

scrapy fetch

scrapy fetch <url>
# 下载给定url的网页,并在终端输出
# 例:scrapy fetch --nolog http://www.example.com/some/page.html

scrapy view

scrapy view <url>
# 开启一个浏览器,并查看url的内容
# 例:scrapy view http://www.example.com/some/page.html

scrapy version

scrapy version [-v]
# 输出scrapy的版本,如果加上-v也会输出python的版本

Project-only commands

scrapy crawl

scrapy crawl <spider>
# 运行一个爬虫
# 例:scrapy crawl myspider

scrapy check

scrapy check [-l] <spider>
# 检查项目或爬虫是否有错误
# 例:scrapy check -l

scrapy list

scrapy list
# 列出当前目录所有的爬虫

scrapy edit

scrapy edit <spider>
# 修改一个爬虫文件
# 例:scrapy edit spider1

scrapy parse

scrapy parse <url> [options]
# 获取给定url网页的内容,并用spider处理它
# 例:scrapy parse http://www.example.com/ -c parse_item

scrapy bench

scrapy bench
# 运行基准测试,模拟测试爬虫的爬取速度
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

X+Y=Z

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值