python 中文 str 以及 unicode区别和互相转换

最新推荐文章于 2022-04-11 14:52:31 发布

原创最新推荐文章于 2022-04-11 14:52:31 发布 · 1.5w 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#python

python 专栏收录该内容

37 篇文章

订阅专栏

本文探讨了在Python中处理Unicode与字符串时遇到的问题及解决办法。通过具体示例展示了如何避免UnicodeDecodeError错误，并提供了两种有效解决方案：将Unicode转换为字符串或将字符串转换为Unicode。

看了 http://www.jianshu.com/p/53bb448fe85b# 这篇兄弟的文章, 深有感触,自己做做测试试试:

加不加u是有区别的哦
unicode到string 只需要encode一下,尤其在我们读取unicode的文本,然后需要进行字符拼接的时候,本身unicode无法进行拼接
string decode之后就是unicode了
string和string, 以及 unicode和unicode 可以进行拼接

这里写图片描述

但是string和unicode在一起就有问题了

这里写图片描述


In [38]: 

In [38]: 

In [38]: a1 + b1
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-38-ffd3f356020c> in <module>()
----> 1 a1 + b1

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinal not in range(128)

我们该怎么办呢

In [39]: a1.decode('utf-8') + b1
Out[39]: u'\u5927\u4e2d'

In [40]: 

In [40]: 

In [40]: a1 + b1.encode("utf-8")
Out[40]: '\xe5\xa4\xa7\xe4\xb8\xad'

这里写图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LifeSecret

关注关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python unicode编码转换

zhaoyangjian724的专栏

08-23

716

>>> a=u'中国' >>> a u'\u4e2d\u56fd' >>> print a 中国 >>> print len(a) 2 >>> str=a.encode('gb2312') #以gb2312编码对unicode对像进行编码 >>> str '\xd6\xd0\xb9\xfa' >>> print str 中国 >>> print len(str) 4 >>> >>>

python字符串与字节串互相转换：str和bytes

BUG？不存在的！

03-27

1696

在Python中，字符串和字节串是两种常见的数据类型，它们在网络编程、文件读写、数据传输等方面都有广泛应用。本文介绍了四种转换方法：str转bytes，bytes转str，bytes转int，int转bytes，希望对您有所帮助。其中，字符串和字节串是两种常用的数据类型，它们在网络编程、文件读写、数据传输等方面都有广泛的应用。使用int.from_bytes()方法将字节串转换为整数，可以指定字节序（大端或小端）和有无符号。使用int.to_bytes()方法将整数转换为字节串，可以指定字节长度和字节序。

参与评论您还未登录，请先登录后发表或查看评论

Python 编码处理之 str与Unicode的区别与使用

量慧实工作室LHStudio的博客

03-11

1385

用python处理中文，读取文件或消息时，如果发现乱码(字符串处理，读写文件，print)，大多数人的做法是，调用encode/decode进行调试，并没有明确思考为何出现乱码，今天我们来讨论一下如何处理编码问题。注意: 以下讨论为Python2.x版本, Py3k下未测试调试时最常出现的错误错误1 1 Traceback(mostrecentcalllast):File"<stdin>",line1,in<module&g...

【Python 2.7】str和unicode的互相转换，摘自《Effective Python》

寒泉

12-21

3万+

str 和 unicode 以下摘自《Effective Python》 python3 有两种表示字符序列的类型：bytes 和 str。前者的实例包含原始的8位值；后者的实例包含Unicode字符。 python2 中也有两种表示字符序列的类型，分别叫做 str 和 unicode 。与 python3 不同的是，str 的实例包含原始的8位值，而 unicode 的实例，则包含 Unico...

python中unicode 和 str相互转化

热门推荐

xydqsy的博客

05-04

6万+

python中的str对象其实就是"8-bit string" ，字节字符串，本质上类似java中的byte[]。而python中的unicode对象应该才是等同于java中的String对象，或本质上是java的char[]。 str: s = "你好" unicode: u = u"你好“ unicode转化为str，采用encode 编码： str = u

Python里的string 和 unicode 区别讲得很明白的文章

weixin_33744854的博客

02-13

223

2019独角兽企业重金招聘Python工程师标准>>> ...

python将unicode和str互相转化的实现

01-21

问题一：将u’\u810f\u4e71’转换为’\u810f\u4e71′ 方法： s_unicode = u’\u810f\u4e71′ s_str = s_unicode.encode(...补充知识：Python最简单的解决列表中只打印UNICODE而不是中文字符的方法答案就是用js

python3中bytes和string之间的互相转换

12-24

总之，理解和熟练掌握`str`和`bytes`之间的转换是Python 3编程中至关重要的，尤其是在处理文本数据和二进制数据交互的场景下。正确地使用编码和解码能确保数据的准确性和程序的健壮性。在实际开发中，要时刻注意数据...

python中的unicode和str编码

poinsettia的专栏

07-20

540

http://blog.youkuaiyun.com/eastmount/article/details/48841593 [Python爬虫] 中文编码问题：raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题 http://my.oschina.net/leejun2005/blog/74430 详解 python 中文编码与处理

pythonunicode和str_关于python2中的unicode和str以及python3中的str和bytes

weixin_39860280的博客

11-29

python3有两种表示字符序列的类型：bytes和str。前者的实例包含原始的8位值；后者的实例包含Unicode字符。python2中也有两种表示字符序列的类型，分别叫做str和unicode。与python3不同的是，str的实例包含原始的8位值，而unicode的实例，则包含Unicode字符。上面两句话我特别不懂，所以文章后面就下是希望为了把上面两句话弄懂。看几个例子：#在python2...

python unicode转换

qq_34309753的博客

04-11

2484

当遇到类似 \u767b\u5f55\u6210\u529f，且类型为 string 可先编码再解码，解码时格式使用：unicode_escape

pythonunicode和str_python unicode 和 str 类型的关系

weixin_39966922的博客

11-29

229

python （2.X）在进行运行时候字符串运算的时候，分为两种类型 str, unicode前者是二进制的形式进行对字符串的保存，后者是以unicode的方式进行保存，一般的工作方式为：str -> decode() -> unicode ->encode() -> str, 在所有的运行时都为unicode是一个良好的习惯，一般来说系统的库都是支持 unicode(个别除外：csv...

Python中的str与unicode处理方法

IAlexanderI的专栏

05-10

2101

原文出处： liuaiqi627 的博客 python2.x中处理中文，是一件头疼的事情。网上写这方面的文章，测次不齐，而且都会有点错误，所以在这里打算自己总结一篇文章。我也会在以后学习中，不断的修改此篇博客。这里假设读者已有与编码相关的基础知识,本文不再再次介绍，包括什么是utf-8，什么是unicode，它们之间有什么关系。str与字节码首先，我们完全不谈unicode。Python1s ...

str 和unicode的互转

zhouyelihua

12-10

802

//str 和unicode的互转 #coding=utf-8 def to_unicode(unicode_or_str): if isinstance(unicode_or_str,str): value=unicode_or_str.decode('utf-8') else: value=unicode_or_str return va...

python 中的unicode与字符串

cjneo的专栏

11-05

3181

python中的str类型和unicode类型是两种不同的类型怎么看呢一个变量 type(val)就能看到它的所属类型有时候从数据库中取出数据，直接print出来： "u/u123" 这就表明它是unicode unicode是python中的内部编码，也就是说很多时候python的内部表示都用它来编码所以有decode encode函数我们用u表

python，unicode转换中文，中文转换unicode

linus.lin的博客

12-22

999

Unicode转中文 python2： >>> s='\u54c8\u54c8' >>> print s.encode('unicode_escape') '哈哈' python3： >>> s='\u54c8\u54c8' >>> s '哈哈' >>> 中文转unicode python2：(待验证) ...

python unicode码转换_python实现unicode转中文及转换默认编码的方法

weixin_36028920的博客

02-09

4535

本文实例讲述了python实现unicode转中文及转换默认编码的方法。分享给大家供大家参考，具体如下：一、在爬虫抓取网页信息时常需要将类似"\u4eba\u751f\u82e6\u77ed\uff0cpy\u662f\u5cb8"转换为中文，实际上这是unicode的中文编码。可用以下方法转换：1、>>> s = u'\u4eba\u751f\u82e6\u77ed\uff0c...

python unicode 转码_关于Python 中unicode 转码的问题

weixin_36149595的博客

02-03

210

Python 中urllib2.urlopen 中存在中文转码问题，解决方法如下：1.import BeautifulSoupimport chardetresponse =urllib2.urlopen(‘%s‘%line)#response.decode(‘utf-8‘)#response = urllib2.urlopen(‘http://www.baidu.com/‘)html = res...

生成文本数据和比特流互相转换的python代码实现