大端法、小端法、网络字节序

本文详细解释了字节序的概念,包括小端法和大端法,以及网络字节序的定义。通过实例展示了不同平台上的字节序,并提供了测试程序以验证不同CPU平台的字节序。最后,介绍了如何将数据转换为网络字节序,以适应网络传输需求。

http://hi.baidu.com/hustor/blog/item/c978dcf3671e6bd00b46e003.html


关于字节序(大端法、小端法)的定义

《UNXI网络编程》定义:术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址,即是小端字节序;大端存在起始地址,即是大端字节序。
 
也可以说:
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端。

举个简单的例子,对于整形0x12345678。它在大端法和小端法的系统内中,分别如图1所示的方式存放。

 
网络字节序

我们知道网络上的数据流是字节流,对于一个多字节数值,在进行网络传输的时候,先传递哪个字节?也就是说,当接收端收到第一个字节的时候,它是将这个字节作为高位还是低位来处理呢?
网络字节序定义:收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前,在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形,在80X86平台中,它是以小端法存放的,在发送前需要使用系统提供的htonl将其转换成大端法存放,如图2所示。
 

字节序测试程序

不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。

 #include <stdio.h>
 #include <netinet/in.h>
 int main()
 {
        int i_num = 0x12345678;
        printf("[0]:0x%x\n", *((char *)&i_num + 0));
        printf("[1]:0x%x\n", *((char *)&i_num + 1));
        printf("[2]:0x%x\n", *((char *)&i_num + 2));
        printf("[3]:0x%x\n", *((char *)&i_num + 3));
     
         i_num = htonl(i_num);
         printf("[0]:0x%x\n", *((char *)&i_num + 0));
         printf("[1]:0x%x\n", *((char *)&i_num + 1));
         printf("[2]:0x%x\n", *((char *)&i_num + 2));
         printf("[3]:0x%x\n", *((char *)&i_num + 3));
     
         return 0;
  } 

在80X86CPU平台上,执行该程序得到如下结果:
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果,在80X86平台上,系统将多字节中的低位存储在变量起始地址,使用小端法。htonl将i_num转换成网络字节序,可见网络字节序是大端法。

总结点:80X86使用小端法,网络字节序使用大端法

<think>我们正在讨论大端序和小端序的查看方。根据引用内容,我们知道字节序指的是多字节数据在内存中的存储顺序。大端序是将最高有效字节存储在最低内存地址,而小端序则是将最低有效字节存储在最低内存地址。 查看方可以分为编程和系统级方: 1. 编程(通过代码检测): - 我们可以使用C/C++、Python等语言编写一个小程序,通过将多字节数据(如整数)的字节表示打印出来,从而判断字节序。 - 例如,我们可以创建一个整数(如0x12345678),然后查看其第一个字节(最低地址处)是0x12还是0x78。如果是0x12,则为大端序;如果是0x78,则为小端序。 2. 系统级方: - 使用命令行工具(如lscpu)可以查看系统字节序(在支持的系统上)。 - 在Linux中,可以通过查看/proc/cpuinfo文件来获取字节序信息(但并非所有系统都直接显示,通常通过其他信息推断)。 - 另外,一些系统提供内置命令或环境变量可以显示。 下面我们分别给出示例: ### 1. 使用C程序检测 ```c #include <stdio.h> int main() { unsigned int x = 0x12345678; unsigned char *p = (unsigned char*)&x; if (*p == 0x78) { printf("Little endian\n"); } else if (*p == 0x12) { printf("Big endian\n"); } else { printf("Unknown\n"); } // 打印所有字节 printf("Byte order: %02x %02x %02x %02x\n", p[0], p[1], p[2], p[3]); return 0; } ``` 运行结果解释: - 如果输出为`78 56 34 12`,则为小端序(最低地址存放最低字节)。 - 如果输出为`12 34 56 78`,则为大端序(最低地址存放最高字节)。 ### 2. 使用Python检测 ```python import sys if sys.byteorder == 'little': print("Little endian") else: print("Big endian") # 另一种方:使用一个整数来查看 x = 0x12345678 data = x.to_bytes(4, sys.byteorder) print("Bytes:", [hex(b) for b in data]) ``` ### 3. 系统命令(Linux) 在终中执行: ```bash lscpu | grep "Byte Order" ``` 或者尝试: ```bash echo -n I | od -to2 | head -n1 | cut -f2 -d" " | cut -c6 ``` 如果输出为`1`,则表示小端序(因为`I`在ASCII中对应的是`49`,而小端存储为`49 00`,所以第二个字节是0);如果输出为`0`,则可能是大端序(大端存储为`00 49`,但这里我们取的是第二个字节,所以是49的最后一个字符?)。这个命令可能不太直观,推荐使用`lscpu`。 ### 4. 在Windows中 可以通过编程(如上述C或Python程序)来检测。 ### 总结 - 编程是最直接和通用的,可以在任何平台上通过编写代码来检测。 - 系统命令则依赖于具体的操作系统。 注意:字节序是硬件层面的特性,通常由CPU架构决定。例如,Intel x86/x86_64架构使用小端序,而网络协议(如TCP/IP)使用大端序(网络字节序)[^1]。 --- ### 相关问题 1. 如何在不同字节序的系统之间转换数据? 2. 网络编程中如何处理字节序问题? 3. 大端序和小端序的优缺点比较? : 引用内容中提到网络传输使用大端序以确保一致性。 </think> ### 如何查看大端序和小端序的方 #### 1. **编程检测(推荐)** 通过代码直接检测当前系统的字节序,这是最可靠的方: ```c #include <stdio.h> int main() { unsigned int x = 0x12345678; // 测试值 unsigned char *p = (unsigned char *)&x; if (*p == 0x78) { printf("小端序 (Little Endian)\n"); } else if (*p == 0x12) { printf("大端序 (Big Endian)\n"); } printf("内存布局: %02X %02X %02X %02X\n", p[0], p[1], p[2], p[3]); return 0; } ``` - **原理**:检查整数 `0x12345678` 的最低内存地址字节: - 小端序:最低地址存储最低字节 `0x78` → 输出 `78 56 34 12` - 大端序:最低地址存储最高字节 `0x12` → 输出 `12 34 56 78` - **适用场景**:跨平台开发、嵌入式系统调试。 #### 2. **Python 快速检测** ```python import sys print("小端序" if sys.byteorder == 'little' else "大端序") ``` #### 3. **系统命令检测** - **Linux/Unix**: ```bash lscpu | grep "Byte Order" # 输出示例:Byte Order: Little Endian ``` - **Windows(PowerShell)**: ```powershell [BitConverter]::IsLittleEndian # 输出 True 表示小端序 ``` #### 4. **内存查看工具** 使用调试工具直接查看内存布局: 1. 在调试器(如 GDB)中设置断点 2. 打印变量内存地址数据: ```gdb x/4xb &x # 显示变量x的4个字节 ``` 3. 根据字节顺序判断: - `78 56 34 12` → 小端序 - `12 34 56 78` → 大端序 ### 关键区别总结 | **特征** | **大端序 (Big Endian)** | **小端序 (Little Endian)** | |----------------|-------------------------------|--------------------------------| | **存储顺序** | 高位字节在低地址(如 `12 34 56 78`) | 低位字节在低地址(如 `78 56 34 12`) | | **常见架构** | PowerPC、网络协议 | x86/x64、ARM[^3] | | **读取逻辑** | 从左到右为高位→低位[^2] | 从左到右为低位→高位 | | **适用场景** | 网络传输、跨平台协议[^1] | 本地计算、高效数据处理[^3] | > 注:字节序是硬件层面的特性,通常由CPU架构决定。网络通信时需统一使用大端序(网络字节序)[^1]。 --- ### 相关问题 1. 网络编程中如何处理不同字节序的数据传输? 2. 如何用代码实现大端序和小端序的相互转换? 3. 哪些现代处理器使用大端序架构?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值