如果你查看文档中的 bytes,它会引导你去 bytearray:
bytearray([source[, encoding[, errors]]])
返回一个新的字节数组。bytearray 类型是在范围 0 <= x < 256 内的可变整数序列。它拥有大多数可变序列类型的常用方法,如Mutable Sequence Types所述,以及bytes类型的大多数方法,请参阅Bytes and Byte Array Methods。
可选的 source 参数可以以几种不同的方式初始化数组:
- 如果它是一个字符串,你必须给出编码(和可选的错误)参数;bytearray() 然后使用 str.encode() 将字符串转换为字节。
- 如果它是一个整数,数组将具有该大小,并将初始化为零字节。
- 如果它是一个符合缓冲区接口的对象,对象的只读缓冲区将被用来初始化字节数组。
- 如果它是可迭代的,它必须是范围为 0 <= x < 256 的整数的可迭代对象,这些整数用作数组的初始内容。
- 如果没有参数,将创建大小为 0 的数组。
因此,bytes 可以做的不仅仅是编码字符串。Pythonic 的地方在于它允许你用任何有意义的源参数类型调用构造函数。
对于编码字符串,我认为 some_string.encode(encoding) 比 bytes(some_string, encoding) 更 Pythonic,因为它是最自文档化的——“用这种编码对这个字符串进行编码”比 bytes(some_string, encoding) 更清晰——当你使用构造函数时没有明确的动词。
我查看了 Python 源代码。如果你使用 CPython 将 unicode 字符串传递给 bytes,它会调用 PyUnicode_AsEncodedString,这是 encode 的实现;所以如果你自己调用 encode,你就跳过了一层间接性。