有时候需要从一个文件中读数据,然后把这些数据加工处理后写入另外一个文件中,这个过程就有可能出现字符编码问题。比如读取一个xml文件,有的字段值读出是asci码,有的就是unicode编码,当把这些不同编码的数据合并在一起处理的时候,就会出现问题。所以在处理文档时,有必要统一字符编码。一个可行的办法就是添加如下代码:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
这样在处理编码不同的字符时,就会统一转成utf8编码处理。
另附一个处理此问题的办法,是在python的库文件中设置,不过这样会有代码移植性问题。
转载:http://blog.youkuaiyun.com/lgy807720302/article/details/7515743
本文介绍了解决Python中处理不同字符编码文件的方法。通过设置默认编码为UTF-8来确保所有字符统一处理,避免了因字符编码不一致导致的问题。
1912

被折叠的 条评论
为什么被折叠?



