【请注意,本文适用情况为:macOS系统下,本身代码显示中文无误,复制进内置文本编辑器打开后中文部分显示乱码的情况。请先检查本身的代码,若代码中中文已经显示为乱码,请先尝试使用.decode(‘utf-8’)或相关方法。】
最近在研究python爬虫的时候,发现了一点小问题。在使用python成功爬取目标网站相关信息后,将其复制到内置文本编辑软件并打开时,出现了所有的中文都变成了反斜杠+字母的情况。
上网搜了一下,大多给出的方法都是修改encode/decode/改utf-8之类的。使用后发现未能解决。后来想了一下,这些解决方法针对的都是在爬取过程的时候就已经产生了乱码的情况,而我检查代码发现,代码本身的中文显示无误。
所以就只能是macOS系统本身的相关设置问题了。解决方法如下:
- 打开文本编辑软件“文本编辑”中的“偏好设置”。
- 在“新建文稿”的“格式”里选择“纯文本”,在“打开与存储”中勾选“将HTML文件显示为HTML代码而显示为格式化的文本”,取消勾选“给纯文本添加txt后缀”。
正常用Safari打开即可。
本文介绍了解决Python爬虫中中文显示为乱码,通过调整macOS内置文本编辑器的编码设置,以及提供正确处理中文编码的建议,确保在编辑器中正常显示中文字符。
1829





