爬虫项目实操五、用Scrapy爬取当当图书榜单

最新推荐文章于 2022-05-26 16:31:15 发布

随风的博客

最新推荐文章于 2022-05-26 16:31:15 发布

阅读量783

点赞数

分类专栏：学习笔记之Python爬虫项目实操

本文链接：https://blog.youkuaiyun.com/weixin_53823523/article/details/116213208

版权

本文介绍如何使用Scrapy框架，爬取当当网2018年图书销售榜单前三页的图书名、作者及价格。通过示例代码详细解析爬虫实现过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目标：使用Scrapy，爬取当当网2018年图书销售榜单前3页的数据（图书名、作者和书的价格）。
URL:http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-year-2018-0-1-1 （最后一个数字1代表第1页，每页20种）

网页源码：
在这里插入图片描述
展开后源码：

代码示例：

items.py文件参考代码# 
#-*- coding: utf-8 -*-
# Define here the models for your scraped items## See documentation in:
# https://doc.scrapy.org/en/latest/topics/items.htmlimport scrapy
class