scrapy网络爬虫
Three123v
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
精通scrapy网络爬虫——第三章 response.xpath()and css()基础语法
首先创建一个用于演示的HTML文档,并构造一个HtmlResponse对象 from scrapy.selector import Selector from scrapy.http import HtmlResponse body = ''' <html> <head> <base href='http://example.com/' /&...原创 2019-11-07 22:42:41 · 3526 阅读 · 1 评论 -
精通scrapy网络爬虫 第三章———利用selector提取数据
创建对象 #创建Selector 对象 from scrapy.selector import Selector text = ''' <html> <body> <h1>Hello World</h1> <h1>Hello Scrapy</h1> <h1>...原创 2019-11-07 22:30:29 · 793 阅读 · 0 评论 -
精通scrapy网络爬虫第一章example
import scrapy class BooksSpider(scrapy.Spider): # 每一个爬虫的唯一标识 name = 'books' # 定义爬虫爬取的起始点,起始点可以是多个,这里只有一个 start_urls = ['http://books.toscrape.com/'] def parse(self, response): ...原创 2019-11-07 18:49:44 · 365 阅读 · 0 评论
分享