spiderkeeper使用教程

本文介绍如何使用pip安装Scrapy及相关的辅助工具,并通过SpiderKeeper进行项目的部署与管理。详细步骤包括创建项目、打包egg文件、上传并运行爬虫。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

安装包

pip install scrapy
pip install scrapyd
pip install scrapyd-client
pip install spiderkeeper

进入到scrapy项目的根目录:

运行scrapyd

scrapyd

如果不出错就会生成一个scrapyd的服务。
736399-20190509092411701-1037520088.png

打开对应页面

736399-20190509092641700-1130876115.png

再另起窗口执行spiderkeeper命令

spiderkeeper

736399-20190509092840527-1906880368.png

打开spiderkeeper的页面

默认用户名:admin
密码:admin

736399-20190509093038817-1685786982.png

创建项目

点击Projects-》Create Project
736399-20190509093351237-1702706314.png

打包egg文件

在scrapy的项目根目录,也就是和setting.py一个等级.

scrapyd-deploy -p chahao -v 1.0 --build-egg chahao.egg

-p后面加的是项目的名字,也就是scrapy爬虫文件的name,后面的内容可以不管,注意最后.egg的文件名规范就行。

点击deploy上传项目

736399-20190509094207849-411478369.png

提交以后看到部署成功即可。
736399-20190509094409093-1300812469.png

执行项目

点击Dashboard然后点击Runonce选择对于的爬虫文件运行即可。
736399-20190509095421932-1092614677.png
成功之后就可以看到上图的情况,刷新页面
可以查看爬虫的日志和运行状态,点击stop即可停止运行爬虫。
736399-20190509095543312-544560199.png

遇到坑

坑1:
提交完了之后,运行文件看不到东西。
看后台发现scrapyd出错了,错误如下
736399-20190509094919538-1485668624.png
可知原因是项目中没有安装msgpack这个包,安装即可,通过这个错误可以知道,在提交项目到spiderkeeper对应的机器时
需要保证该机器的环境能正常运行程序。

转载于:https://www.cnblogs.com/c-x-a/p/10836635.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值