参考:https://docs.scrapy.org/en/latest/topics/items.html#scrapy.item.Item

SPIDER将从网页中提取出来的数据以dict的形式发射出去,这个dict直接写在代码中,很容易写错,也不能复用。
因此Scrapy专门提供了一个类item class,用来专门定义dict的结构,比如包含那些字段名等。这样集中管理不容易出错,出错也容易修改,可以复——提供了很多有用的存取器。
Declaring Items
import scrapy
class Product(scrapy.Item):
name = scrapy.Field()
price = scrapy.Field()
stock = scrapy.Field()
tags = scrapy.Field()
last_updated = scrapy.Field(serializer=str)
就是定义了一个专门用于存取数据的类,然后调用相关的方法就可以存取数据了,有点像JAVA BEAN。
本文介绍Scrapy框架中Item类的使用方法,通过实例演示如何定义数据结构,提高数据管理效率和减少错误,类似于JavaBean,便于数据的存取。
1019

被折叠的 条评论
为什么被折叠?



