ustruct-打包和解压原始数据类型

原创于 2025-07-22 09:28:28 发布 · 960 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#ustruct

QuecPython 专栏收录该内容

81 篇文章

订阅专栏

ustruct 模块实现相应CPython模块的子集。更多信息请参阅CPython文档： struct

格式字符串

格式字符串是用来在打包和解包数据时指定预期布局的机制。其使用指定被打包/解包数据类型的格式字符进行构建。此外，还有一些特殊字符用来控制字节顺序，大小和对齐方式。

字节顺序，大小和对齐方式

默认情况下，C类型以机器的本机格式和字节顺序表示，并在必要时通过跳过填充字节来正确对齐（根据C编译器使用的规则）。根据下表，格式字符串的第一个字符可用于指示打包数据的字节顺序，大小和对齐方式：

Character	Byte order	Size	Alignment
@	native	native	native
=	native	standard	none
<	little-endian	standard	none
>	big-endian	standard	none
!	network (= big-endian)	standard	none

如果第一个字符不是其中之一，则假定为 '@' 。

格式化字符表

Format	C Type	Python type	Standard size
b	signed char	integer	1
B	unsigned char	integer	1
h	short	integer	2
H	unsigned short	integer	2
i	int	integer	4
I	unsigned int	integer	4
l	long	integer	4
L	unsigned long	integer	4
q	long long	integer	8
Q	unsigned long long	integer	8
f	float	float	4
d	double	float	8
P	void *	integer	4

ustruct 方法

ustruct.calcsize

ustruct.calcsize(fmt)

返回存放 fmt 需要的字节数。

参数描述：

fmt - 格式字符的类型，详情见上文格化式字符表

示例：

>>> import ustruct
>>> ustruct.calcsize('i')
4
>>> ustruct.calcsize('f')
4
>>> ustruct.calcsize('d')
8

ustruct.pack

ustruct.pack(fmt, v1, v2, ...)

按照格式字符串 fmt 压缩参数v1、 v2、…。

参数描述：

fmt - 格式字符的类型，详情见上文格化式字符表
v1 , v2 , ... - 是需要进行数据转换的变量名或值

返回值描述：

返回参数编码后的字节对象。

示例：

>>> import ustruct

>>> ustruct.pack('ii', 7, 9)  # 打包两个整数
b'	'

ustruct.unpack

ustruct.unpack(fmt, data)

根据格式化字符串 fmt 对数据进行解压，返回值为一个元组。

参数描述：

fmt - 格式字符的类型，详情见上文格化式字符表
data - 要进行解压的数据

返回值描述：

返回包含解压值的元组(即使只包含一个项)。

示例：

>>> import ustruct

>>> ustruct.unpack('ii', b'	')  # 解压之前打包的两个整数
(7, 9)

ustruct.pack_into

ustruct.pack_into(fmt, buffer, offset, v1, v2, ...)

根据格式字符串 fmt 将值v1、v2、 …打包到从 offset 开始的缓冲区中。从缓冲区的末尾算起， offset 可能为负。

参数描述：

fmt - 格式字符的类型，详情见上文格化式字符表
buffer - 可写数据缓冲区
offset - 写入的起始位置
v1 , v2 , ... - 需要写入缓冲区的数据

示例：

>>> import ustruct

# 定义格式字符串
>>> fmt = "3sB"
# 定义一个字符串和一个整数
>>> name = "Tom"
>>> age = 25

# 将两个值按指定格式打包，并写入bytes类型的空缓冲区中
>>> buf = bytearray(8) # 创建容量为8字节的缓冲区
>>> ustruct.pack_into(fmt, buf, 0, name.encode(), age) # 将"name"编码成bytes类型并写入三个字符(占3个字节)，后面紧跟着一个占1个字节的整数"age"

>>>  print(buf) # 输出：bytearray(b'Tom')
bytearray(b'Tom')

ustruct.unpack_from

ustruct.unpack_from(fmt, data, offset=0)

根据格式化字符串 fmt 解析从 offest 开始的数据解压，从缓冲区末尾开始计数的偏移量可能为负值。

参数描述：

fmt - 格式字符的类型，详情见上文格化式字符表
data - 数据缓冲区(缓冲区大小以字节为单位)
offset - (可选)解压的起始位置，默认为零

返回值描述：

返回解压值的元组(即使只包含一个项)。

示例：

>>> import ustruct

# 定义格式字符串
>>> fmt = "3sB"
# 定义要解包的字节序列
>>> data = bytearray(b'Tom')

# 从字节序列的第一个字节开始解包
>>> result = ustruct.unpack_from(fmt, data, 0)
>>> print(result) # 输出：(b'Tom', 25)
(b'Tom', 25)