Python编码,解码问题

1.打开中文 txt 文件,报错:‘gbk’................:

以二进制打开

open("threekingdoms.txt", "rb").read() 读出来了
open("threekingdoms.txt", "r", encoding='utf-8',errors='ignore').read() 报错

 

 

2.打开中文出现乱码:

encodeing = 'gbk'

 

 

3.decode()

http://www.runoob.com/python/att-string-decode.html

      decode('ascii','igore') 解码遇到 ascii 是,忽略

 

 

4.SyntaxError: Non-UTF-8 code starting with '\xb6' in file 

开头添加:

# -*- coding: gb2312 -*-

 

 

5.UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 6: illegal multibyte sequence

pandas 读取数据是报的错,使用 gbk 的超级  gb18030 即可读取

 

 

6.UnicodeEncodeError: 'gbk' codec can't encode character '\u3635' in position 19: illegal multibyte sequence

pandas to_csv() 保存时报的错误,可以使用编码 utf_8_sig,这样的话不管用 wps,还是 offica 都不是乱码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值