大小端,字节序问题

本文深入解析了字节序(小端法与大端法)及其在网络编程中的作用,重点阐述了如何处理二进制数据流以确保跨平台兼容性,并通过实例代码演示了如何在不同CPU平台上正确处理字节序问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

总结:1、80X86使用小端法,网络字节序使用大端法。

          2、二进制的网络编程中,传送数据,最好以unsigned char, unsigned short, unsigned int

                来处理, unsigned short ,unsigned short 以网络字节序处理后再拷贝到发送的buffer里

          3、结构体前要指定 #pragma  pack(1)   结构体后#pragma  pack() 

对于字节序(大端法、小端法)的定义《UNXI网络编程》定义:术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址,即是小端字节序;大端存在起始地址,即是大端字节序。

也可以说:
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端。

举个简单的例子,对于整形0x12345678。它在大端法和小端法的系统内中,分别如图1所示的方式存放。

zijiexu_pic_1

网络字节序

我们知道网络上的数据流是字节流,对于一个多字节数值,在进行网络传输的时候,先传递哪个字节?也就是说,当接收端收到第一个字节的时候,它是将这个字节作为高位还是低位来处理呢?
网络字节序定义:收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前,在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形,在80X86平台中,它是以小端法存放的,在发送前需要使用系统提供的htonl将其转换成大端法存放,如图2所示。

zijiexu_pic_2

字节序测试程序

不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。

#include <stdio.h>

#include <winsock2.h>

#pragma comment(lib, "WS2_32.lib")

int main()
{
    int i_num = 0x12345678;
    printf("[0]:0x%x/n", *((char *)&i_num + 0));
    printf("[1]:0x%x/n", *((char *)&i_num + 1));
    printf("[2]:0x%x/n", *((char *)&i_num + 2));
    printf("[3]:0x%x/n", *((char *)&i_num + 3));
10  
11     i_num = htonl(i_num);
12     printf("[0]:0x%x/n", *((char *)&i_num + 0));
13     printf("[1]:0x%x/n", *((char *)&i_num + 1));
14     printf("[2]:0x%x/n", *((char *)&i_num + 2));
15     printf("[3]:0x%x/n", *((char *)&i_num + 3));
16  
17     return 0;
18 }


在80X86CPU平台上,执行该程序得到如下结果:
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果,在80X86平台上,系统将多字节中的低位存储在变量起始地址,使用小端法。htonl将i_num转换成网络字节序,可见网络字节序是大端法

### 嵌入式系统中大小端字节序的概念及应用 #### 大小端字节序定义 大端字节序(Big Endian)和小端字节序(Little Endian)是描述多字节数据在计算机内存中存储顺序的方式。对于一个多字节的数据,例如一个32位整数,在大端模式下,最高有效字节被存放在最低地址处;而在小端模式下,则相反,最低有效字节被存放在最低地址处[^2]。 #### 区别 两者的根本区别在于它们如何解释多字节对象的存储位置: - **大端字节序**:高位字节优先存储于低地址。 - **小端字节序**:低位字节优先存储于低地址。 这种差异直接影响到跨平台间的数据交换以及硬件设计的选择。当不同架构之间进行通信时,如果不统一字节序可能会导致错误解析接收到的信息[^1]。 #### 应用场景 在嵌入式领域内,字节序的应用非常广泛,尤其是在以下几个方面: - 数据传输过程中确保接收方能够按照发送方预期的方式来解读消息内容; - 文件格式规定特定编码方式以便兼容多种设备读取; - 设备驱动程序编写需考虑目标处理器支持何种类型的字节序列从而正确操作外设寄存器等资源。 #### 转换方法 实现大小端之间的相互转变可以通过软件层面完成也可以借助专门指令集加速处理速度。以下是几种常见的做法: ##### 使用标准库函数 C/C++语言提供了几个用于改变主机默认字节次序至网络通用形式(通常是big-endian)的标准APIs, 如htonl(), htons() ,ntohl(), ntohs(). 这些功能可以方便快捷地解决因体系结构引起的问题. ```c #include <arpa/inet.h> uint32_t host_to_network_long(uint32_t hostlong){ return htonl(hostlong); } ``` ##### 手动重组字节 另一种更为灵活但可能效率较低的方法就是手动调整每一个组成部分的位置关系直到达到期望的结果为止。这种方法尤其适用于那些没有现成工具可用的情况或者是针对特殊需求定制解决方案的时候[^3]。 ```python import struct def float_endian_swap(f): packed = struct.pack('f', f) swapped_bytes = bytearray(packed)[::-1] result = struct.unpack('f', bytes(swapped_bytes))[0] return result ``` 上述Python代码片段展示了如何利用`struct`模块先将浮点数值打包成二进制表示然后再颠倒其内部组成单元最终得到反转后的版本。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值