scrapy指定item输出项顺序到csv

最新推荐文章于 2022-09-21 11:09:07 发布

枫小Q

最新推荐文章于 2022-09-21 11:09:07 发布

阅读量3.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_35843543/article/details/78183456

scrapy 专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何在Scrapy爬虫项目中实现CSV文件的有序导出，通过自定义CSV导出器并设置特定的字段顺序，确保导出的数据按照预设顺序排列，避免因字段顺序混乱导致的数据错误。

scrapy指定输出项顺序到csv

scrapy -o csv格式输出的时候，发现字段/item/Field的顺序不是在items.py或者在scrapy中指定的顺序，如果后续有继续读取csv文件的时候，因为不是按指定顺序排列，很可能字段会搞错。本文描述如何在输出csv的时候指定顺序字段。

在scrapy的spiders同层目录，新建my_project_csv_item_exporter.py文件内容如下（文件名可改，目录定死）

1

2

3

4

5

6

7

8

9

10

11

from scrapy.conf import settings

from scrapy.contrib.exporter import CsvItemExporter

class MyProjectCsvItemExporter(CsvItemExporter):

def __init__(self, *args, **kwargs):

delimiter = settings.get('CSV_DELIMITER', ',')

kwargs['delimiter'] = delimiter

fields_to_export = settings.get('FIELDS_TO_EXPORT', [])

if fields_to_export :

kwargs['fields_to_export'] = fields_to_export

super(

MyProjectCsvItemExporter, self).__init__(*args, **kwargs)

在同层目录，settings.py文件新增如下内容（指定item,field顺序）

1

2

3

4

5

6

7

8

9

FEED_EXPORTERS = {

'csv': 'my_project.my_project_csv_item_exporter.MyProjectCsvItemExporter',

} #这里假设你的project名字为my_project

FIELDS_TO_EXPORT = [

'id',

'name',

'email',

'address'

]

在同层目录，settings.py文件指定分隔符

1	CSV_DELIMITER = '\t'

全部设定完后，执行scrapy crawl spider -o spider.csv的时候，字段就按顺序来了。

原文链接：http://www.zhiliaonote.com /2017/10/python+scrapy+item/

博客等级

码龄9年

22
原创

147
点赞

531
收藏

32
粉丝

关注

私信

热门文章

分类专栏

python 10篇
scrapy 3篇
hexo 8篇
mac 18篇
linux 23篇
javascript 7篇
Angular 5篇
mysql 1篇
HtmlCss 2篇
git 2篇

展开全部收起

上一篇：: scrapy抓取的中文结果乱码解决办法

下一篇：: python 列表转换成字符串输出

最新评论

SpringBoot项目框架下ThreadPoolExecutor线程池+Queue缓冲队列实现高并发中进行下单业务
优快云-Ada助手: 非常感谢您分享关于在SpringBoot项目框架下实现高并发下单业务的经验，这对于很多开发者来说都是非常有用的。我觉得你可以继续深入探讨如何优化ThreadPoolExecutor线程池和Queue缓冲队列，以更好地应对高并发场景。我建议你可以写一篇关于如何使用ThreadPoolExecutor线程池和Queue缓冲队列来优化高并发业务的技术博文，这样其他开发者就可以更好地应对高并发场景，提升系统的性能和稳定性。相信这样的技术文章对其他用户也会非常有帮助。期待你的下一篇技术博文，谢谢！为了方便博主创作，提高生产力，优快云上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.youkuaiyun.com/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.youkuaiyun.com/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Ubuntu 安装amd 显卡驱动
额，不知道取什么: 我只得到了一个Deb包，哪来的压缩包
决策树算法 (CART分类树)
weixin_50220177: 非常感谢博主的讲解与分享，尤其是当特征存在3分类情况的讲解，令初学者茅塞顿开！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。