Scrapyd制作Docker镜像的步骤

Scrapyd与Docker
本文详细介绍如何使用Docker简化Scrapyd部署过程,避免Python环境及版本冲突问题,实现Scrapy项目的高效部署与调度。

分布式主要通过scrapyd⼯工具来部署,scrapyd是⼀一个运⾏行行Scrapy爬⾍虫的服务程序,它提供⼀一 系列列HTTP接⼝口来帮助我们部署、启动、停⽌止、删除爬⾍虫程序。
Scrapyd⽀支持版本管理理,同时可以管理理多个爬⾍虫任务,利利⽤用它我们可以⾮非常⽅方便便地完成 Scrapy爬⾍虫项⽬目的部署任务调度。如果同时将⼀一个Scrapy项⽬目部署到100台服务器器上,我们需要⼿手 动配置每台服务器器的Python环境,更更改Scrapyd配置吗?如果这些服务器器的Python环境是不不同版 本,同时还运⾏行行其他的项⽬目,⽽而版本冲突⼜又会造成不不惜要的麻烦。所以我将Scrapyd直接打包成⼀一个 Docker镜像,那么在服务器器上只需要执⾏行行Docker命令就可以启动Scrapyd服务,这样就不不⽤用关⼼心 Python环境问题,也不不需要担⼼心版本冲突问题。 备注:后⾯面我只是介绍⼀一下配置步骤,具体服务镜像我已经配置完成并放到DockerHub上了了,新机 器器只需要安装Docker并运⾏行行⼀一下命令即可安装Scrapyd服务,步骤如下:
1、docker login后会提示输⼊入⽤用户名和密码 user: ******
psd: ******
2、docker pull qinexpire/scrapyd
3、docker run -d -p 6800:6800 qinexpire/scrapyd
如何将Scrapyd打包制作成⼀一个Docker镜像? 1、Install Docker
2、新建⼀一个项⽬目,新建⼀一个scrapyd.conf,即Scrapyd的配置⽂文件,内容如下: [scrapyd]
eggs_dir = eggs
logs_dir = logs
items_dir = jobs_to_keep = 5 dbs_dir = dbs max_proc = 0 max_proc_per_cpu = 4 finished_to_keep = 100 poll_interval = 5.0 bind_address = 0.0.0.0
http_port
debug
runner
application = scrapyd.app.application launcher = scrapyd.launcher.Launcher webroot = scrapyd.website.Root
[services]
schedule.json = scrapyd.webservice.Schedule cancel.json = scrapyd.webservice.Cancel addversion.json = scrapyd.webservice.AddVersion listprojects.json = scrapyd.webservice.ListProjects listversions.json = scrapyd.webservice.ListVersions listspiders.json = scrapyd.webservice.ListSpiders delproject.json = scrapyd.webservice.DeleteProject delversion.json = scrapyd.webservice.DeleteVersion listjobs.json = scrapyd.webservice.ListJobs daemonstatus.json = scrapyd.webservice.DaemonStatus
备注:这⾥里里是修改⾃自官⽅方⽂文档的配置⽂文件:https://scrapyd.readthedocs.io/en/stable/ config.html#example-configuration-file
= 6800 = off
= scrapyd.runner
Scrapyd制作Docker镜像的步骤
此处只修改了了bind_address = 0.0.0.0,原本是127.0.0.1,不不能公开访问,这⾥里里修改为0.0.0.0即可接触
此限制 3、新建⼀一个requirements.txt⽂文件,将⼀一些Scrapy项⽬目常⽤用的库放进去
request selenium aiohttp beautifulsoup4 pyquery pymysql pymongo redis
flask
django
scrapy scrapyd scrapyd-client scrapy-redis scrapy-splash
如果运⾏行行的Scrapy项⽬目还需要其他库,可以⾃自⾏行行添加
4、新建⼀一个Dockerfile,内容如下: FROM python:3.6
ADD . /code
WORKDIR /code
COPY ./scrapyd.conf /etc/scrapyd/ EXPOSE 6800
RUN pip3 install -r requirements.txt CMD scrapyd

Scrapyd批量量部署三种⽅方案: 1、按照上⾯面介绍的⽅方式安装docker之后执⾏行行相应命令 2、镜像部署
3、模板部署
Gerapy分布式可视化管理理:
具体安装使⽤用教程可以参考下⾯面链接:https://blog.youkuaiyun.com/fengltxx/article/details/ 79894839

<think> 我们参考了站内引用中关于麒麟V10系统制作docker镜像的方法,结合用户的问题“我想获取在麒麟V10系统上制作docker镜像的方法”,我们需要总结出两种主要方法: 1. 使用麒麟V10的ISO镜像通过虚拟机安装系统后构建镜像(引用[1]提到) 2. 在麒麟V10系统中定制自己的docker镜像(引用[2]提到),同时引用[3]提供了在麒麟V10系统上安装docker的方法,这是制作镜像的前提。 根据用户需求,我们主要介绍两种制作docker镜像的方法,并补充必要的安装docker步骤(因为如果没有安装docker,则无法进行镜像制作)。 注意:用户问题明确是“制作docker镜像”,因此我们重点在制作方法上。 方法一:通过现有系统构建镜像(类似于使用Dockerfile构建) 方法二:使用虚拟机安装麒麟V10系统后,将该系统导出为docker镜像(需要一些转换工具) 然而,引用中并没有详细说明具体构建步骤,因此我们需要结合docker的一般制作方法来描述,并指出在麒麟V10系统上的注意事项。 同时,我们注意到引用[3]提供了在麒麟V10上安装docker步骤,因此我们可以先介绍安装docker,然后再介绍两种制作镜像的方法。 步骤规划: 1. 在麒麟V10系统上安装docker(引用[3]的方法) 2. 方法一:使用Dockerfile定制镜像(通用方法,引用[2]提到的第二种方式) 3. 方法二:将虚拟机安装的麒麟V10系统导出为docker镜像(引用[1]提到的步骤,但需要更详细说明) 由于引用[1]中步骤4(构建镜像文件)并没有详细说明,我们可以补充一种常见做法:使用tar命令将系统文件打包,然后通过docker import导入为镜像。 因此,我们给出两种方法的具体步骤。 注意:麒麟V10是基于CentOS的,因此大部分命令与CentOS兼容。 开始回答: </think> ### 在麒麟V10系统上制作Docker镜像的方法 #### 一、准备工作:安装Docker环境 在制作镜像前需确保麒麟V10系统已安装Docker: ```bash # 配置阿里云CentOS 8镜像源 curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-8.repo # 配置阿里云Docker镜像源 yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo sed -i 's+download.docker.com+mirrors.aliyun.com/docker-ce+' /etc/yum.repos.d/docker-ce.repo # 修改repo使用CentOS 8源 echo "8" > /etc/yum/vars/centos_version sed -i 's/$releasever/$centos_version/g' /etc/yum.repos.d/docker-ce.repo sed -i 's/$releasever/$centos_version/g' /etc/yum.repos.d/CentOS-Base.repo # 安装Docker yum makecache yum erase podman buildah yum install docker-ce -y systemctl start docker ``` > 注:需先移除冲突组件`podman`和`buildah`[^3] #### 二、制作Docker镜像的两种方法 ##### 方法1:基于Dockerfile定制镜像(推荐) 1. **创建Dockerfile** ```dockerfile # 使用麒麟V10基础镜像(需先获取或构建) FROM kylinv10-base:latest # 安装所需软件 RUN yum install -y nginx python3 # 复制应用文件 COPY ./app /opt/app # 暴露端口 EXPOSE 80 # 设置启动命令 CMD ["nginx", "-g", "daemon off;"] ``` 2. **构建镜像** ```bash docker build -t custom-kylin:v1 . ``` ##### 方法2:通过虚拟机系统转换 1. **在VMware中安装麒麟V10** - 从[银河麒麟官网](https://www.kylinos.cn)下载ISO镜像 - 完成完整系统安装[^1] 2. **导出系统为镜像文件** ```bash # 在虚拟机内操作 cd / tar --numeric-owner --exclude=/proc --exclude=/sys -cvf kylin-rootfs.tar / ``` 3. **导入为Docker镜像** ```bash # 在宿主机操作 cat kylin-rootfs.tar | docker import - kylinv10-base:latest ``` #### 三、验证镜像 ```bash docker run -it --rm kylinv10-base:latest cat /etc/os-release ``` 应输出: ``` NAME="Kylin Linux Advanced Server" VERSION="V10 (Tercel)" ``` > **关键注意事项**: > 1. 麒麟系统需使用`centos_version`变量适配CentOS 8源[^3] > 2. 通过虚拟机转换时需排除/proc和/sys目录 > 3. 官方未提供预构建镜像时,需自行构建基础镜像
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诗雅颂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值