9.5 Scrapy项目管道爬取58实战代码

spider文件:
yield函数 ,这个函数没有结束,还可以继续返回,这里千万不能return,return就结束了1条数据。
这才yield出去到管道,才管道开始了。
yield item是yield到管道,yield request是yield到调度器。
管道文件pipline.py文件
天生有一个管道,但是这个管道里面什么都没有。之前讲过管道有4个函数。
首先打开一个文件,print(打开文件了)关闭一个,print(关闭文件了),中间是管道

问题来了如何写入文件:
如何把一个个对象写入文件。涉及到序列化,即把对象变成一个文本。如何把dictionary写入到文本中呢?经典方案是import jaon,把它变成一个json的字符串,然后存起来就ok了。
即:序列号函数json.dumps(),item其实就是一个dictionaty,但是离真正还是差一点。
<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值