web信息中常会遇到“\u4f60\u597d”类型的字符。首先’\u‘开头就基本表明是跟unicode编码相关的,“\u”后的16进制字符串是相应汉字的utf-16编码。python里decode()和encode()为我们提供了解码和编码的方法。其中decode('unicode_escape')能将此种字符串解码为unicode字符串。
比如:
str1 = '\u4f60\u597d'
print str1.decode('unicode_escape')
你好有篇讲python编码的文章比较好,http://blog.youkuaiyun.com/liuxincumt/article/details/8183391
另附两个在线工具
1、汉字转换unicode编码
http://www.bangnishouji.com/tools/chtounicode.html
2、汉字编码查询
http://xn--p8s370b.xn--fiqs8s/
本文介绍如何使用Python处理网页中常见的“u4f60u597d”类型字符,通过decode('unicode_escape')方法将其转换为可读的中文字符。同时提供了关于Python编码的文章链接及在线工具。
3272





