scrapy的安装和创建

最新推荐文章于 2021-01-11 23:28:47 发布

原创最新推荐文章于 2021-01-11 23:28:47 发布 · 425 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#scrapy #spider #安装 #创建 #ROBOTSTXT_OBEY

爬虫专栏收录该内容

7 篇文章

订阅专栏

安装scrapy

新建虚拟环境article_spider
安装scrapy

安装报错：

error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
1

解决方法：

http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载twisted对应版本的whl文件
Twisted‑17.5.0‑cp35‑cp35m‑win_amd64.whl），cp后面是python版本，amd64代表64位，运行
pip install C:\Users\Twisted-17.5.0-cp35-cp35m-win_amd64.whl

安装完成后运行：

pip install -i https://pypi.douban.com/simple/ scrapy

新建scrapy项目

1. 运行如下命令：

scrapy startproject ArticleSpider

完整：

(article_spider) C:\Users\Administrator\Evns\projects>scrapy startproject ArticleSpider

2. 通过pycharm把项目导入进来

pipelines.py:数据存储

middlewares.py:中间件

items.py: 类似于django中的form,定义数据保存的格式

spiders文件：存放具体某个网站的爬虫

cd ArticleSpider

scrapy genspider (spider名称)jobbole (网站域名)blog.jobbole.com

jobbole.py

start_urls : 是一个list，存放需要爬取的所有url。

启动一个scrapy命令

安装pywin32

pip install -i https://pypi.douban.com/simple  pypiwin32

然后启动：

scrapy crawl jobbole

在main.py中配置进来：

execute(["scrapy", "crawl", "jobbole"])

开始调试

在setting.py中：

默认遵循robots协议：

网络爬虫排除标准 : (告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取)

不设置的话，会默认去读取每一个网站上的robots协议，把不符合robots协议的过滤掉。

ROBOTSTXT_OBEY = False

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

MonCheri_Flowers

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」

blues_C的博客

08-06

3553

欢迎来到“Python 爬虫入门”系列的第九篇文章。本篇文章将深入介绍 Scrapy 的安装及使用。Scrapy 是一个广泛使用的爬虫框架，其强大的功能和灵活的扩展性使得它在数据抓取领域占有重要地位。本文将从 Scrapy 的安装步骤开始，详细介绍其基本使用方法，包括创建项目、编写爬虫、解析数据、存储数据等内容。通过本篇文章的学习，你将能够掌握使用 Scrapy 进行高效数据抓取的技能。

scrpayd安装与scrapy爬虫的部署

nopotential的博客

02-21

2446

以前我用scrapy写爬虫的时候都是通过crawl来执行的，但这样的运行方式只能执行一个爬虫，如果想同时运行多个爬虫可以考虑使用scrapyd的方式，也就是scrapy server。查看http://scrapyd.readthedocs.io/en/stable/index.html 了解更多关于scrapyd的知识。

参与评论您还未登录，请先登录后发表或查看评论

爬虫记(二) - Idea安装Scrapy & Scrapy入门

一个幽灵

11-25

3816

我用Intellij IDEA写Python脚本，IDEA装上Python插件之后跟PyCharm差不多。安装Scrapy 链接 Pycharm中的scrapy安装教程 - xiaoli2018 - 博客园步骤 * 打开IDEA的settings->Plugins，点击，搜索并安装Python插件 * 新建Python项目 * 执行方法一或方法二 * 记住scrapy.ex...

idea 集成scrapy

with_dream的博客

01-11

2706

https://blog.youkuaiyun.com/u014738683/article/details/78072484 1、安装idea 2、安装python插件需要注意python可能有多个安装位置 3、brew install pip安装pip 4、pip3 install scrapy 可能会失败再试几次 5、创建scrapy startproject tutorial 6、在spiders目录下创建Spider import scrapy; class QuotesSpider(scrapy.Sp

如何安装Scrapy

galesaur_wcy

08-27

5166

嗯.....有个小瑕疵就是每次新建一个工程都得改下interpreter 先去官网上下载Scrapy和Twisted 自己对应自己的版本 http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 将这两货添加到自己的python那下载完成之后去环境变量系统变量Path添加完成之后去命令行cmd 先进去到咋们的python那两...

Scrapy库安装和项目创建

weixin_30731287的博客

03-07

133

Scrapy是一个流行的网络爬虫框架，从现在起将陆续记录Python3.6下Scrapy整个学习过程，方便后续补充和学习。本文主要介绍scrapy安装、项目创建和测试基本命令操作 scrapy库安装　　使用pip命令安装scrapy,在安装过程中可能会因为缺少依赖库而报错，根据报错提示依次下载需要的依赖库，下载过程中注意系统类型和Python版本　　我在安装过程中依次安装的库有...

Intelij idea 集成scrapy开发环境

破阵的专栏

09-23

5397

以Macos sierra0.12.6 为例 1.安装Intelij idea下载地址 https://www.jetbrains.com/idea/download/#section=mac2.安装idea 支持 python 开发的插件Preferences -> Plugins 3.mac 神器homebrew（已经安装好pip的同学，这一步请忽略）命令/usr/bin/ruby -e "$

mac安装scrapy并创建项目的实例讲解

12-24

在Mac上安装Scrapy并创建...总的来说，安装Scrapy并在Mac上创建项目涉及到安装Python 3.5，配置pip3，安装Scrapy，以及编写和运行爬虫代码。理解这些步骤对于初学者来说至关重要，能够帮助你快速上手Python爬虫开发。

精选资源

scrapy爬虫教程（一）–scrapy安装及生成项目

01-20

创建项目终端中执行scrapy startproject 项目名称如scrapy startproject lagouspider 执行命令后生成的项目目录结构如下：在项目目录中执行生成爬虫模板文件的命令执行scrapy genspider 爬虫文件名域名如...

【Python爬虫：Scrapy】之 PyCharm 搭建Scrapy环境+创建Scrapy项目实例

12-21

在命令行（CMD）中，分别执行以下命令来安装Scrapy所需的两个Python模块：Twisted和Scrapy。 - `pip install twisted` - `pip install scrapy` 安装完成后，通过`pip list`检查这两个模块是否已成功安装。三、...

安装scrapy，多次失败，经验总结

Fighting_ZJ的博客

03-20

744

安装scrapy库，我尝试了两天多次，终于成功最开始用pycharm，pip安装都失败，发现这个库不简单。（因为我之前pip个更新和安装其他的库吃了很多瘪，历经‘千辛万苦’，所以这次已经不是很惊讶了）于是我开始到处找博客，看到很多方法（下面我列出来，怎么说我都是败了，有些复制了别的博主的方法，如有冒犯，求原谅） ...

小白如何使用——IntelliJ IDEA的安装以及创建项目

成小新的博客

03-27

1万+

小白使用idea的安装使用教程，从第一步开始

利用pip install scrapy时安装出错

u014619105的博客

06-17

4369

在利用pip install scrapy时，提示：error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools出错

python3.7安装Scrapy----2019

最强菜鸟

02-21

1万+

Scrapyd 安装与配置

FreeSpider

08-29

2318

本文以ubuntu16.04为基础进行安装。 1、使用命令安装scrapyd： sudo pip3 install scrapyd 2、配置执行如下命令创建配置文件： sudo mkdir /etc/scrapyd sudo vim /etc/scrapyd/scrapyd.conf 然后到如下网址将配置文件内容复制进去，保存即可： https://scrapyd.readth...

scrapy插件安装

落叶的博客

06-23

449

pip install pywin32 1、安装wheel pip install wheel 2、安装lxml https://pypi.python.org/pypi/lxml/4.1.0 3、安装pyopenssl https://pypi.python.org/pypi/pyOpenSSL/17.5.0 4、安装Tw...

Python 3.7 爬虫之 Scrapy 框架安装及配置（一）

Hack_Different的博客

11-07

3578

一，安装Python3.7 二，安装pip 三，安装pywin32 四，安装pyOpenSSL 五，安装lxml 六，安装zope.interface 七，安装twisted 八，安装Scrapy 九，一键升级所有库，Python 3.7亲测可用，创建一个测试类即可案例环境：Python 3.7，pip 18.1 一，安装Python3.7 下载地址：https://www...

Python3.7下安装scrapy框架