
爬虫学习
路啦路
博客仅当作个人笔记使用
展开
-
scrapy入门之meta——不同解析函数之间数据的传递不对应问题
meta参数传递数据不对应问题这是个困扰我好几天的大坑,工作中需要爬去新闻网站的新闻数据,总出现item在不同函数之间传递时出现数据不对应的问题,比如url和title对不上之类的,后来知道是由于meta传递的数据是浅层拷贝的原因导致的。scrapy的meta的作用就是在执行scrapy.Request()函数时把一些回掉函数中需要的数据传进去,meta必须是一个字典,在下一个函数中可以使用r...原创 2019-07-13 13:17:58 · 1115 阅读 · 0 评论 -
Scrapy爬虫框架入门(一)——阳光政务平台
爬取的起始页:投诉_阳光热线问政平台目的是爬取这些投诉的标题、内容、图片、发帖时间等信息。1、创建Scrapy项目使用全局命令startproject创建项目,创建新文件夹并且使用命令进入文件夹,创建一个名为yangguang的Scrapy项目。格式为:scrapy startproject +项目名scrapy startproject yangguang该命令将会创建包含下列内...原创 2019-07-04 18:00:25 · 407 阅读 · 0 评论