声明:仅供学习交流使用
- items.py ->内容模板
import scrapy
class QqduItem(scrapy.Item):
book = scrapy.Field()
bookId = scrapy.Field()
chapter = scrapy.Field()
chapterId = scrapy.Field()
content = scrapy.Field()
- book.py ->爬虫文件
# -*- coding: utf-8 -*-
import scrapy, sys
from qqdu.items import QqduItem
from scrapy.http import Request
reload(sys)
sys.setdefaultencoding("gbk")

这篇博客详细介绍了如何利用Python的Scrapy框架爬取小说网站的数据。内容包括定义items.py中的内容模板,编写book.py爬虫文件,以及设置pipelines.py进行数据处理和在settings.py中启用管道。
最低0.47元/天 解锁文章
234

被折叠的 条评论
为什么被折叠?



