前言
一个python刚到门槛水平的程序员是如何使用crawlab爬取网站,在这里做个图文教程记录下。
提示:这里做一个简单的网站爬取完整示例图文教程
一、创建项目
- 首先,我们将创建一个 Scrapy 项目,咱们从安装 Scrapy 开始。
pip install scrapy
- 然后,创建一个名叫 scrapy_quotes 的 Scrapy 项目。
scrapy startproject scrapy_quotes
现在您应该可以看到新创建爬虫的目录结构。
- 然后执行下面命令生成一个新的爬虫。
cd scrapy_quotes
scrapy genspider quotes quotes.toscrape.com #