python2.7的乱码问题

最新推荐文章于 2020-11-23 13:46:04 发布

原创最新推荐文章于 2020-11-23 13:46:04 发布 · 289 阅读

0 ·

CC 4.0 BY-SA版权

python实践专栏收录该内容

5 篇文章

订阅专栏

本文探讨了Python中gbk和Unicode编码的区别，通过实例演示了不同编码下字符串的处理方式及长度差异。解释了如何解决UTF-8和Unicode的编码问题，并讨论了文件声明不同编码格式的影响。

pydev不提示变量的时候用alt+/ 来解决

看了http://blog.youkuaiyun.com/kiki113/article/details/4062063这篇文章之后的疑问：

问题1：gbk和unicode编码的不同

#coding:gbk
ss='哈哈'
print ss
ss1=u'哈哈'
print len(ss),len(ss1)
print ss==ss1

结果：

哈哈
4 2
True

为什么相同但是长度不一样？

问题2：

解决utf-8格式和unicode和编码问题

s1=u'哈哈'
s='哈哈'
utf8_s=unicode(s,'utf-8')
utf8_s==s1
True
print utf8_s
哈哈
print s1
哈哈

python默认读取文本的格式为ansi，如果将文本的格式转化为utf-8则需要解码

例如:print open("Test.txt").read().decode("utf-8")

问题3:

声明文件的格式不同

文件的编码格式决定了在该源文件中声明的字符串的编码格式

即意味着如果声明为gbk编码的文件，最好文件也声明为gbk格式的，如果文件为utf-8格式的话，容易出错。

s='你好'
s1=u'你好'
s
'\xe4\xbd\xa0\xe5\xa5\xbd'
s1.encode('utf-8')
'\xe4\xbd\xa0\xe5\xa5\xbd'
s==s1.encode('utf-8')
True

以上代码说明控制台程序默认的格式是utf-8编码

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wode701

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Win10搭建Anaconda（Python 3.6.4） + OpenCV + PyQt5 + PyCharm（附带安装Eric6）

Dragon_Prince的博客

03-26

2948

一、安装Anaconda这个没什么好说的，去官网下载安装就是了，注意勾选添加到环境变量。默认已经装了pip，后面的东西都用pip来安装，这里按照系统中只有Anaconda自带的Python3来写，如果有2.x版本的Python的话要注意把pip换成pip3。在命令行输入python，得到下图结果就说明Python安装成功了。可以先把Anaconda的源换成国内的，不然下载很慢，参见这里换成清华的源...

python2.7中文乱码问题及解决方法（2）

口袋里的小小哥的博客

09-29

1167

1.在.py文件的最开始添加： # -*- coding: utf-8 -*- 2.在给string赋值时前面加u： words=u"哈哈哈哈哈哈哈哈哈" 3.处理中文文本文件时：使用codecs附加编码打开文件 import codecs f=codecs.open("wordarray",'r','utf-8') --------...

参与评论您还未登录，请先登录后发表或查看评论

python 2.7之中文乱码问题

weixin_43183405的博客

07-28

355

问题：从前端传过来的数据，需要在后端通过python写入文件中，如果全是英文时，就不会出现乱码，若有中文则会出现下面的情况：左面是前端的原数据，右面是后端通过python写到文件中的数据。出现这种情况的原因是编码格式不一致。一、先判断前端的编码格式，可通过Notepad++打开源文件，发现源文件是windows的ANSI编码格式，若是将其转换成utf-8格式，就不会出现乱码情况。二、找到了...

关于Python2.7得到结果乱码的问题解决办法

coder_Gray的博客

08-01

1005

相信这个问题已经困扰了很多人很久，同样我也是这个问题的受害者。网上的解决方案众说纷纭，不过大多都是针对特定问题的特定解决办法。此方法之在Python2.7中测试有效，其他版本也可尝试。下面这种方法，适用于所有这类问题。不需要在输出时，或者调用函数转化，直接在最前面加上三行代码即可。import sys reload(sys) sys.setdefaultencoding('utf-8')将这

python 2.7的字符串编码问题

08-13

1万+

【如何计算汉字字符串的长度】 s=u"我的" len(s)=2 print(s.encode('utf-8')) # utf-8环境汉字长度是以字为单位，print的时候必须编码为非unicode字符【unicode字符】“ unichr(11) # 将十进制的11转换为unicode字符 u'\0x0b'，其作为dict的value调试时显示空格，作为key时显示

Python2.7 读取中文，显示为乱码的问题

Arthur Guo 的专栏

01-27

4294

Python2.7 在读取包含汉字的文件，并打印内容时候，显示出来的汉字都会变成乱码或者16进制的数字... 核心是编码解码问题。猫哥的解决方法如下：先看包含汉字的文件ChCont.txt 中文汉字 1234 程序如下： import sys codetype = sys.getfilesystemencoding() fh = open("ChCont.

解决Python2.7读写文件中的中文乱码问题

09-20

在使用Python2.7进行文件读写操作时，中文乱码问题是一个常见的困扰。Python2.7由于其自身的历史原因，在处理中文编码时不像后续版本那样直接和高效。本文将探讨如何在Python2.7环境下有效地解决读写文件时遇到的...

解决python2.7 查询mysql时出现中文乱码

09-10

综上所述，解决Python 2.7操作MySQL时的中文乱码问题，需要从数据库配置、Python连接参数、脚本编码声明以及数据读取解码等多方面进行考虑和调整。正确配置这些环节，可以确保中文数据在Python和MySQL之间的正确传输...

python2.7 和pymysql安装依赖包

12-06

linux SUSE 上安装python2.7及pymysql所有依赖的包汇总

PyCharm使用python2.7乱码

热门推荐

Steven的博客

03-19

5万+

在学习使用Python的过程中，一定会遇到文字输入与处理，这就不可避免的会使用中文字符。但是Python2.7默认使用的字符集是ASCII，并不支持中文字符的显示与处理，因些如果要在Python中处理中文就需要进行一些额外的处理。一、在开头处声明Python使用UTF-8编码显示字符#/usr/bin/env python # -*- coding: UTF-8 -*-但这样做，只是让你的程序在运行

Python2中文乱码处理

巩庆奎

05-18

3万+

背景本文在Window 10 python2.7.13下运行测试。python处理中文字符时存在很多问题，根源在于python表示汉字有两种表示形式和Window系统编码之间的矛盾。本文通过实验，力争弄清几者之间的关系。首先说理论基础。理论基础一、Python中文字符有两种表示形式：一种是如a='巩庆奎'，另一种是b=u'巩庆奎'。前者表示的是字符串编码，是Str类型，值根据采用的编码（utf、g...

centOS7.4+python2.7.5+matplotlib中文乱码问题解决

JuicyActiveGilbert的博客

02-19

636

其中字体文件可以自行下载或者直接从windows目录下拷贝。 windows下步骤相同，唯一变化的是对应文件目录不同，根据自己情况进行查找即可。详细步骤如下： (1)上传.ttf文件至matplotlib的font目录（/usr/lib64/python2.7/site-packages/matplotlib/mpl-data/fonts/ttf）下； (2)上传.tff文件至系统font目录...

python3默认字符编码_Python3的字符编码乱码问题解决思路

weixin_39535527的博客

11-23

286

在乱码问题上，Python3相比Python2已经好多了，但在处理外来字符时比如文件或者网站时还是会出现乱码问题。乱码的原因很多，一个是来源的字符编码在接收时处理不当，编程语言默认的UTF8处理gb2312字符时没声明encoding，当然会出错。二是在代码用到的第三方代码使用了默认encoding处理了。三是在控制台或者文本编辑器中，这些程序本身也有默认的encoding。这三个环节没处理好都会...

处理Python2.7读写文件中的中文乱码问题

haha_point的博客

09-12

1万+

Python2.7对于中文编码的问题处理的并不好，这几天在爬数据的时候经常会遇到中文的编码问题。这里总结了文件读写中遇到的中文乱码问题的解决方案，供大家交流和学习。

python的pyserial模块接收串口助手发送HEX过来接收到非16进制乱码问题

SingWeek

12-31

1万+

python在调用pyserial通信的时候，接收到串口调试助手或者设备发送过来的HEX值，在特定位置会出现错误编码，接收到的不是十六进制数据，而是一些乱符号，' ', '!', '"', '#', '$', '%', '&', '\'', '(', ')', '*', '+', ',', '-', '.', '/'等等，这个是因为serial中没有对应的解码机制，pyth...