scrapy提取数据的三种方法:CSS、XPATH、RE。
这里学习一下怎么使用CSS提取器提取有用的数据。参考自http://www.scrapyd.cn/doc/。
这里需要有一定的CSS基本,下面附上学习CSS的链接http://www.runoob.com/css/css-tutorial.html。
1、爬取网页信息
scrapy shell http://lab.scrapyd.cn/page/1/
2、标签内容的提取
<title>Scrapy 中文网</title>
<div class="post-content" itemprop="articleBody">
<p>看官,此页面只为爬虫练习使用,都是残卷,若喜欢可以去找点高清版!</p>
<p><img src="http://lab.scrapyd.cn/usr/uploads/2018/02/3875934880.jpg" alt="1.jpg" title="1.jpg"></p>
<span style="font-family: Arial, Verdana, sans-serif;"></span>
<p><img src="http://lab.scrapyd.cn/usr/upl