因工作需要,需实现如题所示功能。查阅网上博客,资料,大多都是针对python2的,而且很多地方不明所以,所以自己整理了一下查阅的结果,重新写一篇博客。
预备知识
1、python3的默认字符串类型
Python 2.x 同时支持ASCII和 Unicode字符串,默认情况下是ASCII编码。而 Python 3中这种支持刚好调换:Unicode现在变成了默认类型,而 ASCII 字符串现在称为 bytes。 bytes 数据结构包含字节值,并且它
不应该再被视为一个字符串,因为它是一个包含数据的不可变字节数组
上面这句话出自《python核心编程》(第三版)。这造成了python2和python3的很大的不兼容性。就是很多方法在python2中可用,但是在python3中不可用。幸运的是python提供了解决这种问题的方法。
如果想把默认字符串转换成bytes类型,既把Unicode变成ASCII
# 方法一
bytes("str",encoding="utf8") # encoding="utf8"参数不可省略
egg:
bytes("中国",encoding="gbk")
b'\xd6\xd0\xb9\xfa'
bytes("中国",encoding="utf-8")
b'\xe4\xb8\xad\xe5\x9b\xbd'
#方法二
"str".encode(encoding="utf8") # encoding="utf8"可省略,因为已经是默认参数
egg:
"中国".encode(encoding="gbk")
b'\xd6\xd0\xb9\xfa'
"中国".encode(encoding="utf8")
b'\xe4\xb8\xad\xe5\x9b\xbd'
#上面两种方法的意思是一样的,就是按某种编码的方式,将Unicode转变成ASCII。其中