Python编码错误处理

本文解决Python在处理含有中文字符的文件时出现的UnicodeEncodeError问题,介绍了如何设置默认编码为UTF-8,并针对Windows平台提供了特定解决方案。

   如题,我用python 解析文件(文件中含有中文),并写入其他文件时报错:

   UnicodeEncodeError: 'ascii' codec can't encode characters

   经过google大神的指导,确定以下解决方式:

   #coding:utf-8       import sys      reload(sys)       sys.setdefaultencoding('utf-8') 

   疑问:为什么需要reload呢?

   grep -r -i 'setdefaultencoding' /usr/lib/python2.7    输出结果为:
   /usr/lib/python2.7/site.py:        sys.setdefaultencoding(encoding) # Needs Python Unicode build !
   /usr/lib/python2.7/site.py:    # Remove sys.setdefaultencoding() so that users cannot change the
   /usr/lib/python2.7/site.py:    if hasattr(sys, "setdefaultencoding"):
   /usr/lib/python2.7/site.py:        del sys.setdefaultencoding
   Binary file /usr/lib/python2.7/site.pyc matches

   把del sys.setdefaultencoding 防止用户在改变defaultencoding ,这个原因暂时真不知。。

   对于windows平台,上面的办法真不行,对于python 2.x中,总是存在这个问题,在Python 3.x的时候这真不是个事,

  对于windows 平台,

 文件开头声明为 #coding=utf-8,

 写入字符串时,转换编码为GBK

file.write(str.encode('gbk'))

  还要注意的是:open(....) 不能有任何运算,一次 只能写入一行,所以要用 + 来连成一行






本文转自 位鹏飞 51CTO博客,原文链接:http://blog.51cto.com/weipengfei/1030862,如需转载请自行联系原作者

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值