scrapy基础知识之将item写入JSON文件，unicode如果用中文显示可以在pipelines中设置如下

最新推荐文章于 2025-01-12 15:29:02 发布

俊晗

最新推荐文章于 2025-01-12 15:29:02 发布

阅读量553

点赞数

CC 4.0 BY-SA版权

分类专栏： Scrapy

本文链接：https://blog.youkuaiyun.com/gqv2009/article/details/79624825

3 篇文章

订阅专栏

本文介绍Scrapy框架中的日志配置方法及不同日志级别的含义，并解决了在使用Scrapy过程中遇到的日志级别问题。此外，还讲解了如何正确处理JSON文件中的中文编码问题，确保输出的JSON文件能正确显示中文。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

 setting:
 https://doc.scrapy.org/en/latest/topics/logging.html#topics-logging

 日志级别

 Python的内置日志记录定义了5个不同的级别来指示给定日志消息的严重性。这里是标准的，按递减顺序列出：

 COOKIES_ENABLED = 
 False

 #
 下载延迟限制

 #DOWNLOAD_DELAY = 1

 #
 输出日志等级

 #LOG_LEVEL = 'DEBUG'

 #LOG_LEVEL = 'INFO'

 #
 不加以下设置以
 json
 格式打印

 #LOG_LEVEL = 'ERROR'

  LOG_LEVEL = 'CRITICAL' 

 =========================================================================

 以 上错误Scrapy 版本问题。scrapy=1.5.0 改成 scrapy=1.4.0

 2、scrapy基础知识之将item写入JSON文件，unicode如果用中文显示可以在pipelines中设置如下：

 https://www.cnblogs.com/nana-tech/p/5751167.html

 设置之后的结果：

 在使用json.dumps时要注意一个问题

 import
  json
 print
  json.dumps(
 '中国'
 )
 # 输出结果："\u4e2d\u56fd"

 输出的会是'中国' 中的ascii 字符码，而不是真正的中文。

 这是因为json.dumps 序列化时对中文默认使用的ascii编码.想输出真正的中文需要指定ensure_ascii=False：

 import
  json
 print
  json.dumps(
 '中国'
 )
 # 输出结果："\u4e2d\u56fd"
 
 print
  json.dumps(
 '中国'
 ,ensure_ascii=
 False
 )
 # 输出结果："中国"

 你要去看 open 第三个参数默认值是什么，因为默认不是 utf-8写的吧，就算内容编码了，不用 utf-8写也会乱码，估计是这样

 ============================================================================