Scrapy
X+Y=Z
代码不会骗人
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Windows安装Scrapy
Windows下使用pip install scrapy安装Scrapy的时候,安装过程中会报如下错误:由上图可知,这是在构建twisted的时候报的错,提示需要安装Microsoft Visual C++ 14.0。这是因为在安装twisted的时候需要依赖Microsoft Visual C++ 14.0库。(注:twisted是一个异步的网络框架,Scrapy基于twisted)。...原创 2018-12-24 15:01:22 · 213 阅读 · 0 评论 -
Scrapy入门程序
要爬取的网站为:http://quotes.toscrape.com/创建一个项目scrapy startproject tutorial会创建一个tutorial目录,里面的内容如下tutorial/ scrapy.cfg # deploy configuration file tutorial/ # project's ...原创 2018-12-24 15:06:55 · 244 阅读 · 0 评论 -
Scrapy命令行工具
配置文件1、/etc/scrapy.cfg or c:\scrapy\scrapy.cfg (system-wide),2、~/.config/scrapy.cfg ($XDG_CONFIG_HOME) and ~/.scrapy.cfg ($HOME) for global settings(user-wide)3、scrapy.cfg inside a scrapy project’s ...原创 2018-12-25 21:12:23 · 435 阅读 · 0 评论 -
Scrapy爬虫简介
SpiderSpider是所有爬虫的基类,所有的爬虫必须继承该类或其子类,用来发送请求及解析网页爬虫执行流程1、调用start_requests()方法发送请求,并指定响应的回调函数,默认为parse2、在parse中解析响应,从网页中提取数据3、将提取的数据存入文件或者数据库爬虫的主要属性与方法name:爬虫的名字,必须唯一allowed_domains:可选字段,允许爬取的域...原创 2019-01-05 17:17:59 · 630 阅读 · 1 评论
分享