Windows下Python读取中文问题首行\ufeff处理

最新推荐文章于 2025-05-05 09:44:02 发布

lial2001

最新推荐文章于 2025-05-05 09:44:02 发布

阅读量293

点赞数

CC 4.0 BY-SA版权

分类专栏： python 文章标签：中文处理 python

本文链接：https://blog.youkuaiyun.com/lial2001/article/details/89668730

python 专栏收录该内容

1 篇文章

订阅专栏

本文讲解了在Python中处理中文文件时遇到的编码问题，特别是如何解决因BOM（Byte Order Mark）导致的文件读取错误。文章指出，在读取包含BOM的文件时，应使用utf-8-sig编码方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先处理中文时要在python源文件的顶部加入
在这里插入图片描述
然后，如果在读取文件时首行出现\ufeff这个字符，说明输入文件编码带有BOM（Byte of Order Mark），这时encoding参数应该选择带有签名的utf-8（“utf-8-sig”）处理读取文件中要设置读取文件的编码方式
Byte of Orders涉及多字节字符在内存的存储方式，有little-endian和big-endian之分，有兴趣的可以去了解一下。