UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte seque

本文介绍了解决Python中遇到的UnicodeEncodeError错误的方法,包括文件编码指定、PYTHONIOENCODING环境变量设置及sys模块编码设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

        html = response.read()
        str_html = html.decode()
        f = open('baidu.html', 'w+')
        for values in str_html:
            f.write(values)
        f.close()


上面代码编译的时候出现了:UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte seque

 

对比了一下,应该f的编码格式是GBK的,但是其它的是UTF-8的。所以指定一下编码格式即可。。

 

  f = open('baidu.html', 'w+',encoding='utf-8')

2019.10.24,继续更新编码相关的。

问题有点类似,所以放在一起总结:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u548c' in position 0: ordinal not in range(128)

除了上面的编码解决外,还可以使用PYTHONIOENCODING

在运行python命令前添加参数 PYTHONIOENCODING=utf-8 python test.py

参考文章

第三种方法:

import sys 
reload(sys)
sys.setdefaultencoding('utf8')

我的code:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#from codecs import open
import codecs
import sys 
#reload(sys)
#sys.setdefaultencoding('utf8')
sys.path.append("/usr/lib/python2.7/site-packages/") 


from pypinyin import pinyin,lazy_pinyin,Style
import pypinyin

def chinese2pinyin( words ):
    print('hello')
    print(pinyin(u'中心', style=Style.NORMAL))
    list = lazy_pinyin(words)
    print list


if __name__ == '__main__':
    print('start: ')
    s = '中国'
    chinese2pinyin(s.decode('utf-8'))

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值