linux中爬虫框架scrapy的快速安装及搭建(一)

本文详细介绍了如何使用Scrapy框架搭建一个web抓取项目。从新建虚拟环境开始,到使用清华大学镜像加速安装Scrapy,再到PyCharm中创建项目和爬虫文件夹的全过程。适合初学者快速上手。

scrapy是一个快速、高层次的web抓取框架

  1. 新建虚拟环境
    具体解释看上一篇推文,
    输入: >mkvirtualenv -p /usr/bin/python3 Articlespider
    在这里插入图片描述

  2. 安装scrapy
    可以直接使用:>pip install scrapy下载,但是速度比较慢
    也可以寻找镜像下载(我这里用的清华大学的):>pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scrapy
    安装如果提示: Failed building wheel for xxx
    可以在 https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 找到对应的安装包进行安装

  3. 在pycharm中新建scrapy项目
    在Documents中新建一个文件夹scrapy,在命令行中进入scrapy文件夹:>cd /home/ailiya/Documents/scrapy
    在文件夹中建立scrapy项目:>scrapy startproject Articlespider
    进入项目:>cd Articlespider

  4. 在pycharm中导入Articlespider
    file->new project->zai
    在location中填写Articlespider的位置打开:
    在这里插入图片描述

  5. 创建爬虫文件夹
    在命令行中输入:>scrapy genspider jobbole blog.jobbole.com(爬虫的网站)
    打开pycharm,可以看到文件夹创建成功
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值