Scrapy的piplines.py存储文件和存储mongodb

一、将数据保存到文件

1.piplines.py文件

 1 import json
 2 
 3 class TencentPipeline(object):
 4 
 5     def open_spider(self,spider):
 6         if spider.name=='hr_tencent':
 7             self.file=open('data.json','w')
 8 
 9     def process_item(self, item, spider):
10         if spider.name=='hr_tencent':
11             data=dict(item)
12             # data=json.dumps(data,ensure_ascii=False)
13             data=json.dumps(data)
14             self.file.write(data+',\n')
15         return item
16 
17     def close_spider(self,spider):
18         if spider.name=='hr_tencent':
19             self.file.close()

2.settings.py文件

1 ITEM_PIPELINES = {
2    'tencent.pipelines.TencentPipeline': 300,
3 }

 

 

二、将数据保存到mongodb

1.piplines.py文件

 1 from pymongo import MongoClient
 2 
 3 
 4 class Tencent1Pipeline(object):
 5     def open_spider(self,spider):
 6         if spider.name == 'hr_tencent1':
 7             self.client=MongoClient('127.0.0.1',27017)
 8             self.tencent=self.client['tencent']['tencent']
 9     def process_item(self,item,spider):
10         if spider.name == 'hr_tencent1':
11             print(item)
12             self.tencent.insert(dict(item))
13             return item
14     def close_spider(self,spider):
15         if spider.name == 'hr_tencent1':
16             self.client.close()

2.settings.py文件

1 ITEM_PIPELINES = {
2    'tencent.pipelines.Tencent1Pipeline': 299,
3 }

 

转载于:https://www.cnblogs.com/returnes/p/10458479.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值