Python读取文件编码及内容
最近做一个项目,需要读取文件内容,但是文件的编码方式有可能都不一样。有的使用GBK,有的使用UTF8。所以在不正确读取的时候会出现如下错误:
UnicodeDecodeError: 'gbk' codec can't decode byte
而且当你使用rb模式读取文件时候,返回的结果通过django返回的json会出现下面错误:
TypeError: b'\xbc\x8c\xe6\x9c\xaa\xe6\x9d\xa5' is not JSON serializable
总之就是编码不对,所以要先能识别文件的编码方式,然后根据此编码方式进行对文件编码,最后返回文件内容。
解决方法如下:
with open(
Python识别与处理文件编码

在处理不同编码的文件时,Python需要正确识别文件的编码方式以避免读取错误。文章介绍了遇到的GBK和UTF8编码问题,以及使用'rb'模式读取文件导致的JSON错误。解决方案包括使用第三方库chardet来检测文件编码,然后根据检测结果进行解码,以确保内容正确返回。
最低0.47元/天 解锁文章
722

被折叠的 条评论
为什么被折叠?



