
爬虫
文章平均质量分 58
「已注销」
这个作者很懒,什么都没留下…
展开
-
cheeriojs官方API(翻译)
昨天偶尔发现这么个用于nodejs抓取页面模块的一个库,官方介绍它说是一种为服务器特别定制的,快速、灵活、实施的jQuery核心实现。大致浏览了下,它的语法确实和jquery很像,所以觉得应该能很快就能上手的。先上一段代码let cheerio = require('cheerio') let $ = cheerio.load('<h2 class="title">Hello world</h2>'翻译 2016-08-06 16:20:15 · 2468 阅读 · 0 评论 -
scrapy学习笔记
本文转自:http://python.jobbole.com/86584/?utm_source=blog.jobbole.com&utm_medium=relatedPostsscrapy是python最有名的爬虫框架之一,可以很方便的进行web抓取,并且提供了很强的定制型,这里记录简单学习的过程和在实际应用中会遇到的一些常见问题 一、安装 在安装scrapy之前有一些依赖需要安装,否则可能会转载 2016-11-14 08:45:18 · 1745 阅读 · 0 评论 -
scrapy爬取豆瓣电影
这两天学习了下scrapy,并试着用它爬取了大家都扎堆爬的豆瓣排名前250的电影,中间提升了自己对scrapy的认识,并踩了一些坑总结一下。(以下内容基于Python3.5;scrapy1.3.3下)只想看代码,here that is! 1.定义所需爬取元素的model items.pyimport scrapyclass DoubanscrapyItem(scrapy.Item):原创 2017-05-18 22:53:36 · 4106 阅读 · 0 评论