Python2.7UTF-8导致中文乱码问题

最新推荐文章于 2024-05-22 20:26:52 发布

转载最新推荐文章于 2024-05-22 20:26:52 发布 · 374 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：https://my.oschina.net/u/2902720/blog/1492150

文章标签：

#python

本文介绍了解决Python2.7在处理UTF-16编码文本时出现的中文乱码问题的方法。通过使用decode('utf-16-le')函数或io.open()方法并指定正确的编码方式，可以正确读取和处理中文字符。

Python2.7UTF-8导致中文乱码问题解决办法

file = open('data.txt','r')

lines = file.readlines()

for line in lines[0:1]:
    print line,
    print line.split()

运行后

0.0200197   1.97691e-005

['0\x00.\x000\x002\x000\x000\x001\x009\x007\x00', '\x001\x00.\x009\x007\x006\x009\x00

这是因为在UTF-16，每个字符占用两个字节。*如果你的字符都是ASCII码，这意味着UTF-16编码看起来像编码一个额外的“\\设备后，每个字符的ASCII码。
要解决这个问题，只需解码数据：

print line.decode('utf-16-le').split()

或者用IO或编解码器模块在文件级执行相同的操作：

file = io.open('data.txt','r', encoding='utf-16-le')

这是一种简单化：每个BMP字符占用两个字节；每个非BMP字符变成代理项对，每两个代理人以两字节。

参考：https://stackoverflow.com/questions/19328874/python-read-text-file-with-weird-utf-16-format

转载于:https://my.oschina.net/u/2902720/blog/1492150

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chouheng1261

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

解决Python2.7读写文件中的中文乱码问题

09-20

解决文件路径或文件名中的中文乱码问题，可以通过在Python脚本的首行添加编码声明，明确使用utf-8编码，例如： ```python # -*- coding: utf-8 -*- ``` 这行代码可以避免因编码不一致导致的编译错误。其次，在读取...

解决python2.7 查询mysql时出现中文乱码

09-10

- MySQL数据库的默认编码可能是非UTF-8的，例如'latin1'，这会导致存储或查询中文时出现问题。要解决这个问题，你需要修改MySQL的配置文件`my.cnf`。在Ubuntu系统中，你可以通过`sudo vim /etc/mysql/my.cnf`打开这...

参与评论您还未登录，请先登录后发表或查看评论

python输出utf-8中文出现乱码

沉瑜的博客

01-31

1545

解决办法：将utf-8改为utf-8-sig ！好用

python中文乱码如何处理、如何处理跨域_Windows 命令行下解决python utf-8中文输出的终极解决方案...

weixin_39800990的博客

12-04

193

代码参考了这里：http://wiki.python.org/moin/P...上文对各种系统无法输出奇葩编码的字符做了总结，本文中只针对windows cmd下GBK编码(cp936)但想执行utf-8编码的Python文件进行修改。原理就是：Another is to put an intercept between sys.stdout, and the text wrapper.更多还是看...

Python 2.7之中文乱码问题

Why_not_try的博客

11-11

1008

学习python一段时间了，一直没有写过博客。就从今天开始吧！ python 3之后当然不存在乱码问题了。python 2的乱码问题有时就有点头疼了。(代码均为在windows下测试) 示例：保存为test1.py 报错信息如下：解决办法：我将代码保存为test.py，运行：不出所料，第八行输出的为乱码，第九行第十行输出正常,这是在开头加上了第二行

python如何解决中文乱码问题

hakesashou的博客

05-22

2797

强制转换为unicode编码，在 Python 中编码是可以互相转换的，比如从utf-8转换为gbk，不同编码之间不能直接转换，需要通过unicode字符集中间过渡下，从上面基础知识可知unicode是一种字符集，不属于编码，而utf-8是具体实现unicode思想的一种编码。raw_input 是获取用户输入值的，获取到的用户输入值和当前运行环境编码有关，比如 cmd 下默认编码是 gbk，那么输入的汉字就是以gbk编码，而不管 demo.py 文件编码格式和编码声明。

python2.7默认编码修改为utf-8

kepengs的博客

09-11

5753

在python的lib文件夹下找到site-package文件夹在其中新建一个sitecustomize.py的文件内容为： import sys reload(sys) sys.setdefaultencoding('utf-8') 重启环境

解决Python发送Http请求时,中文乱码的问题

09-16

- `msg.encode('utf-8')`: 将字符串转换成UTF-8编码格式，解决中文乱码问题。 - `quote()`: 对URL中的特殊字符进行编码，确保URL格式正确。 **示例代码**： ```python # -*- coding: UTF-8 -*- # Python 2.7 from ...

ubuntu修改python2.7的默认编码方式为utf-8

echo_gou的博客

07-04

895

sudo gedit /usr/lib/python2.7/sitecustomize.py然后修改文件内容为

Python2.7输出中文显示乱码问题笔记_UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xc4 in position 0

u014685432的博客

05-12

2325

Python中文编码问题(字符串前面加'u')

python打开csv文件乱码_解决Python2.7读写文件中的中文乱码问题

weixin_39644377的博客

11-24

836

Python2.7对于中文编码的问题处理的并不好，这几天在爬数据的时候经常会遇到中文的编码问题。但是本人对编码原理不了解，也没时间深究其中的原理。在此仅从应用的角度做一下总结，1.设置默认编码在Python代码中的任何地方出现中文，编译时都会报错，这时可以在代码的首行添加相应说明,明确utf-8编码格式，可以解决一般情况下的中文报错。当然，编程中遇到具体问题还需具体分析啦。#encoding:ut...

python2.7中文编码

qianmosolo的博客

06-06

850

问题1：在编辑器（如Notepad++）中print '中文' SyntaxError: Non-ASCII问题2：在编辑器（如Notepad++）中#-*- coding：utf-8- *- print '中文' 在windows cmd乱码：涓枃问题3：：在编辑器（如Notepad++）中# -*- coding: utf-8 -*- print '中文'.decode('utf-8') #

【python】2.7中文乱码

不活跃，人常在。

07-16

1079

起因：写python的环境是python3.7，运行python的环境是python2.7，原本完美显示的中文小提示一下体验喂了狗，力挽狂澜为显示中文义不容辞。过程：显示为乱码原因：不同语言处于不同编码集合。在多语种文本中，使用一种字符编码无法全 ...

python2.7编码与解码

weixin_30284355的博客

05-26

246

常见的编码　　ASCII: 美国人发明的，只编码英文字母和符号，1个字节。　　GB2312: 中国人发明的，增加了中文汉字和符号，2个字节。　　Unicode: 为了把所有语言都统一到一套编码里，一般是2个字节，生僻字4个字节。　　UTF-8：为了节省英文字符内存空间，UTF-8可变长编码，常用的英文字母被编码成1个字节，汉字通常是3个字节，生僻的字符编码成4-6个字节。 1 &gt...

Python2.7中文乱码常见问题FAQ

锐意工作室

02-19

3010

文章目录解释和解决Python2.7中文乱码问题万恶之源FAQPython源文件中含有中文时运行出错在Python文件开头声明UTF-8编码后，仍然打印乱码写入文件时，文件名乱码UnicodeEncodeError错误读取/文件的行时格式错误文件内容乱码讨厌encode()和decode()参考文档解释和解决Python2.7中文乱码问题万恶之源 Python2.x中的str类型并不是真正意义...

utf-16le 导入mysql,使用UTF-16LE编码读取csv的快速方法

weixin_31951319的博客

01-20

586

I'm dealing with .csv files with UTF-16LE encoding, this method works to read the files, but read.csv is very slow compared to read_csv.read.csv2(path,dec=",",skip=1,header=T,fileEncoding="UTF-16LE",s...

python 中文乱码-解决Python2.7读写文件中的中文乱码问题

weixin_37988176的博客

10-29

1364

python乱码问题_解决python2.7常见的中文乱码问题

weixin_39586395的博客

11-30

1095

解决中文乱码的三个问题1、代码里有中文内容，控制台报“SyntaxError: Non-ASCII character '\xe8' in file D:/workplace/batchGetData/venv/com/get_org_id.py on line 42, but no encoding declared; see http://python.org/dev/peps/pep-026...

python2.7 连mysql时出现中文乱码