Scrapy的安装和基本了解

Scrapy推荐安装步骤

1. 升级pip

指令:python -m pip install --upgrade pip

在这里插入图片描述

2. 安装wheel

指令:pip install wheel

在这里插入图片描述

3. 安装lxml

先检查python的版本,对应下载是选64还是32
在这里插入图片描述

下载lxml
在这里插入图片描述

安装lxml

指令:pip install lxml-4.5.2-cp38-cp38-win_amd64.whl

在这里插入图片描述

4. 安装Twisted

先检查python的版本,对应下载是选64还是32
在这里插入图片描述

下载Twisted
在这里插入图片描述

安装Twisted

指令:pip install Twisted-20.3.0-cp38-cp38-win_amd64.whl

在这里插入图片描述

5. 安装scrapy

指令:pip install scrapy

在这里插入图片描述

安装成功
在这里插入图片描述

6. Scrapy指令

在这里插入图片描述

指令一:测试电脑当前爬取速度性能 — bench

指令:scrapy bench

指令二:将网页内容下载下来,然后在终端打印当前返回的内容,相当于 request 和 urllib 方法 — fetch

指令:scrapy fetch <url>

指令三:在新项目中创建一个新的spider文件 — genspider

指令:scrapy genspider mydomain mydomain.com
mydomain为spider文件名,mydomain.com为爬取网站域名

指令四:运行spider — runspider

指令:scrapy runspider <spider_file.py>

指令五:返回系统设置信息 — settings

指令:scrapy settings [options]
比如:scrapy settings --get BOT_NAME

指令六:打开 scrapy 显示台,类似ipython,可以用来做测试 — shell

指令:scrapy shell [url]

指令七:创建一个新项目 — startproject

指令:scrapy startproject myproject

指令八:显示scrapy版本 — version

指令:scrapy version [-v]

指令九:将网页内容保存下来,并在浏览器中打开当前网页内容,直观呈现要爬取网页的内容 — view

指令:scrapy view <url>

7. 使用scrapy创建爬虫项目

在这里插入图片描述

项目目录结构

scrapydemo
	-- scrapydemo
		  -- _pycache_
		  -- spiders
			  		-- _pycache_
			  		-- __init__.py
		  -- __init__.py
		  -- items.py
		  -- middlewares.py
		  -- pipelines.py
		  -- settings.py
	-- scrapy.cfg

持续更新ing…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值