Scrapy
X+Y=Z
代码不会骗人
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Windows安装Scrapy
Windows下使用 pip install scrapy 安装Scrapy的时候,安装过程中会报如下错误: 由上图可知,这是在构建twisted的时候报的错,提示需要安装Microsoft Visual C++ 14.0。这是因为在安装twisted的时候需要依赖Microsoft Visual C++ 14.0库。(注:twisted是一个异步的网络框架,Scrapy基于twisted)。...原创 2018-12-24 15:01:22 · 213 阅读 · 0 评论 -
Scrapy入门程序
要爬取的网站为: http://quotes.toscrape.com/ 创建一个项目 scrapy startproject tutorial 会创建一个tutorial目录,里面的内容如下 tutorial/ scrapy.cfg # deploy configuration file tutorial/ # project's ...原创 2018-12-24 15:06:55 · 244 阅读 · 0 评论 -
Scrapy命令行工具
配置文件 1、/etc/scrapy.cfg or c:\scrapy\scrapy.cfg (system-wide), 2、~/.config/scrapy.cfg ($XDG_CONFIG_HOME) and ~/.scrapy.cfg ($HOME) for global settings(user-wide) 3、scrapy.cfg inside a scrapy project’s ...原创 2018-12-25 21:12:23 · 435 阅读 · 0 评论 -
Scrapy爬虫简介
Spider Spider是所有爬虫的基类,所有的爬虫必须继承该类或其子类,用来发送请求及解析网页 爬虫执行流程 1、调用start_requests()方法发送请求,并指定响应的回调函数,默认为parse 2、在parse中解析响应,从网页中提取数据 3、将提取的数据存入文件或者数据库 爬虫的主要属性与方法 name:爬虫的名字,必须唯一 allowed_domains:可选字段,允许爬取的域...原创 2019-01-05 17:17:59 · 630 阅读 · 1 评论
分享