- 博客(2)
- 收藏
- 关注

原创 scrapy框架-新智联招聘爬取数据(仅供学习参考),熟知-jsonpath的应用
一,创建项目:scrapy startproject 项目名称 》cd 项目目录 手动或者命令(scrapy genspider 爬虫名称 域名)创建spider文件 tree结构图如下:│ main.py│ scrapy.cfg│ __init__.py│├─zhilian│ │ items.py│ │ middlewares.py│ │ MYmiddlewares...
2018-07-04 12:13:36
1068
原创 爬虫框架-Scrapy项目(博客园spiders文件)
#(第一)获取一级分类交给管道处理import scrapy,re from bokeyuan.items import BokeyuanItem from w3lib.html import remove_tags #处理标签的模块class Bokeyuan(scrapy.Spider): name = 'bokeyuan' allowed_domains = ['cnblogs....
2018-06-28 10:12:06
278
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人