python爬虫之scrapy框架（一）————scrapy框架理论和环境的搭建

Scrapy爬虫环境搭建与使用

最新推荐文章于 2025-10-04 20:38:43 发布

原创最新推荐文章于 2025-10-04 20:38:43 发布 · 415 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#scrapy #python

python大数据（爬虫）专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了如何搭建Scrapy爬虫环境，包括安装必要的库如lxml、twisted和scrapy，以及创建Scrapy项目的过程。此外，还阐述了Scrapy项目的基本目录结构，包括配置文件、数据模型、中间件、数据存储和项目设置。

一、搭建环境

1、Scrapy框架是一个异步框架

2、基于Twiisted库（Twiisted库又依赖于Lxml库，所以要首先安装lxml库）

3、升级piip工具：python -m pip install -U pip

4、安装步骤：

（1）安装lxml：pip3 install lxml

（2）安装twisted：pip3 install twisted

（3）安装scrapy：pip3 install scrapy

（4）安装关联模块pypiwin32：pip3 install pypiwin32

二、Scrapy框架的使用

1、运行图：

2、创建项目

运行命令：scrapy startproject 项目名称

3、项目目录结构

（1）scrapy.cfg（配置文件）

（2）item.py：

在item中定义用于存储爬取到的数据的数据模型

（3）middlewares.py：

一般用于存储中间件的数据

（4）piplines.py：

将返回的数据进行存储

（5）settings.py：

整个项目的设置文件

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。