python3
在读文件时,用到了字符串处理方法, 所以将读出的内容转为str
decode()默认转为utf-8编码,但当文件包含其他编码格式内容时,可能就会出错。所以通过制定编码不是一个好的解决办法。
可以:
(1) l_bytes.decode("unicode_escape")
(2) l_bytes.decode(encoding="utf-8", errors="strict")
另外,不一定必须将bytes转为str, 比如 <class 'bytes'> 中也有类似split 等处理函数,可以直接使用
本文探讨了在Python中读取文件时遇到的编码问题,特别是如何处理包含多种编码格式的内容。介绍了使用decode()方法时指定unicode_escape及设置错误处理方式strict的技巧,同时指出直接使用bytes类型进行文件操作的可能性。
1万+

被折叠的 条评论
为什么被折叠?



