爬虫
文章平均质量分 86
Charlie。
Github地址:https://github.com/caoyucharlie
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫爬取动态网页下载美女图片
xcv原创 2018-06-08 16:11:24 · 5508 阅读 · 0 评论 -
用Scrapy爬取笔趣阁小说
今天早上无聊,去笔趣阁扒了点小说存Mongodb里存着,想着哪天做一个小说网站有点用,无奈网太差,爬了一个小时就爬了几百章,爬完全网的小说,不知道要到猴年马月去了。再说说scrapy这个爬虫框架,真是不用不知道,一用吓一跳,这个实在太好用了,比自己用request,Beautifulsoup这些模块来爬,实在要简单不知多少倍。废话不多说,现在开始上代码。首先用virtualEnv创建虚拟环境并pi...原创 2018-06-08 09:25:42 · 7132 阅读 · 0 评论 -
Scrapy爬取豆瓣
在 movie 的setting中,会有spider这个类,里面有种子url以及解析import scrapy from douban.items import MovieItem class MovieSpider(scrapy.Spider): name = 'movie' allowed_domains = ['movie.douban.com'] start_u...原创 2018-06-05 15:08:48 · 3712 阅读 · 0 评论 -
python面向对象多线程爬虫爬取搜狐页面(1)
class SpiderThread(Thread): def __init__(self, spider, tasks): super().__init__(daemon=True) self.spider = spider self.tasks = tasks def run(self): while True: pass原创 2018-05-31 16:09:37 · 3014 阅读 · 0 评论
分享