python读写文件出现\ufeff

本文详细介绍了BOM(Byte Order Mark)的作用及其在不同编码中的应用。BOM用于指示UTF-16编码的字节顺序,并且可以用于标识UTF-8编码。此外还提到了Python中如何处理带有BOM的文件。

The Unicode character U+FEFF is the byte order mark, or BOM, and is used to tell the difference between big- and little-endian UTF-16 encoding.


BOM —— Byte Order Mark,中文名译作“字节顺序标记”。 这样如果接收者收到 FEFF,就表明这个字节流是 Big-Endian 的;如果收到FFFE,就表明这个字节流是 Little- Endian 的。因此字符 "Zero Width No-Break Space" (“零宽无间断间隔”)又被称作 BOM。
UTF-8 不需要 BOM 来表明字节顺序,但可以用 BOM 来表明编码方式。字符 "Zero Width No-Break Space" 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流,就知道这是 UTF-8编码了。Windows 就是使用 BOM 来标记文本文件的编码方式的。
以上信息来源百度百科

BOM

 

(字节顺序标记(ByteOrderMark))


python中读写文件出现BOM,跟encoding的方式有关,解决方法是将'utf-8-sig'修改为'utf-8'。详细的介绍见

https://stackoverflow.com/questions/17912307/u-ufeff-in-python-string



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值