from openpyxl import Workbook class TuniuPipeline(object): def __init__(self): #创建excel,填写表头 self.wb = Workbook() self.ws = self.wb.active self.ws.append(['用户id', 'source', 'raw_txt', 'txt', ]) # 设置表头 def process_item(self, item, spider): # 具体内容 if isinstance(item,WeiboItem): line = [item['id'], item['source'], item['raw_text'], item['text']] # 把数据中项整理出来 self.ws.append(line) # 将数据需要保存的项以行的形式添加到xlsx中 self.wb.save(r'D:\pycharm\爬虫\csv\web.xlsx') # 保存xlsx文件 return item 如图所示
scrapy框架存储数据到excel
最新推荐文章于 2024-07-23 17:03:32 发布