Spider
Damingxkl
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Scrapy框架流程图详解
(一)、Scrapy框架介绍:我们写一个爬虫,需要做很多事情,比如:发送网络请求、数据解析、数据存储、反爬虫、反反爬虫(更换ip代理、设置请求头等)、异步请求等。这些事情在我们每一次写爬虫代码的时候都要自己从零开始写的话,比较浪费时间。因此 Scrapy 把一些基础的东西封装好了,在它上面写爬虫可以变的更加高效。(二)、Scrapy架构图及各个组件:流程图(1):流程图(2):Scra...原创 2019-11-10 18:16:49 · 4474 阅读 · 0 评论 -
xpath练习
DouyuSpider今天学习了xpath方法, 拿斗鱼主播的房间信息做一个练习,有不足之处希望各位大佬帮忙斧正。#encoding=utf-8from selenium import webdriverimport time, jsonclass DouyuSpider: def __init__(self): self.start_url = "http...原创 2019-11-04 21:39:37 · 429 阅读 · 0 评论 -
内涵段子所有段子Spider
抓取代码#encoding=utf-8import requestsimport jsonimport reclass NeihanSpider: def __init__(self): self.headers = {"user-agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/53...原创 2019-10-31 14:22:59 · 713 阅读 · 0 评论 -
猫眼top100部高分电影spider
第一次尝试Spider,是个突破#encoding=utf-8import requestsimport reclass MaoYantop: def __init__(self): self.url = "https://maoyan.com/board/4?offset={}" self.headers = {"user-agent": "M...原创 2019-10-30 21:56:17 · 465 阅读 · 0 评论
分享