__author__ = 'li shilin'
# 关于字符编码的详解 www.cnblogs.com/luotianshuai/articles/5735051.html
# 打印系统的默认编码
import sys
print(sys.getdefaultencoding())
# 字符间的转换
test_code = "你好"
print(test_code.encode("utf-8"))
# utf-8 转换为 GBK
# UTF-8 ----> Unicode ----> GBK
# 将utf-8的格式先转换成为Unicode 然后再转为GBK 显示出来的是将 字符转化成为了byte类型
# 如果要看到的结果是中文 那么就在decode("GBK")后面的个是一定要写清楚不然默认的是前面已经转换成的格式 就会报错
utf_to_gbk = test_code.encode("UTF-8").decode("UTF-8").encode("GBK").decode("GBK")
print("GBK...",utf_to_gbk)
# GBK ----> UTF-8
# UTF-8 ----> Unicode ----> GBK
# 将GBK的格式先转换成为Unicode 然后再转为UTF-8 显示出来的是将 字符转化成为了byte类型
# 如果要看到的结果是中文 那么就在decode("UTF-8")后面的个是一定要写清楚不然默认的是前面已经转换成的格式 就会报错
gbk_to_utf8 = test_code.encode("GBK").decode("GBK").encode("UTF-8")
print("UTF-8...",gbk_to_utf8)
#其他的编码转换都是一样的
下面是转换的思维图 (Unicode包含了utf8、GBK、GB2312等字符编码 所以在转换的时候需要经过Unicode)

本文详细介绍了字符编码的基础知识,包括如何查看系统默认编码,并演示了常见编码如UTF-8与GBK之间的转换过程。通过实例说明了不同编码间的转换步骤及注意事项。
1927

被折叠的 条评论
为什么被折叠?



