大端法、小端法、网络字节序 转

本文详细介绍了字节序的概念、定义及其与网络字节序的区别,通过C语言实例展示了如何在不同平台下判断字节序,并提供了大小端转换的实现方法,有助于理解数据在内存中的存储顺序及其在网络传输过程中的处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 
一.概念、定义
关于字节序(大端法、小端法)的定义
《UNXI网络编程》定义:术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址,即是小端字节序;大端存在起始地址,即是大端字节序。

 

也可以说:
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端。

举个简单的例子,对于整形0x12345678。它在大端法和小端法的系统内中,分别如图1所示的方式存放。

zijiexu_pic_1 

 

网络字节序

我们知道网络上的数据流是字节流,对于一个多字节数值,在进行网络传输的时候,先传递哪个字节?也就是说,当接收端收到第一个字节的时候,它是将这个字节作为高位还是低位来处理呢?
网络字节序定义:收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前,在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形,在80X86平台中,它是以小端法存放的,在发送前需要使用系统提供的htonl将其转换成大端法存放,如图2所示。

zijiexu_pic_2

 

字节序测试程序
不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。
#include <stdio.h>
#include <netinet/in.h>
int main()
{
    int i_num = 0x12345678;
    printf("[0]:0x%x\n", *((char *)&i_num + 0));
    printf("[1]:0x%x\n", *((char *)&i_num + 1));
    printf("[2]:0x%x\n", *((char *)&i_num + 2));
    printf("[3]:0x%x\n", *((char *)&i_num + 3));
10  
11     i_num = htonl(i_num);
12     printf("[0]:0x%x\n", *((char *)&i_num + 0));
13     printf("[1]:0x%x\n", *((char *)&i_num + 1));
14     printf("[2]:0x%x\n", *((char *)&i_num + 2));
15     printf("[3]:0x%x\n", *((char *)&i_num + 3));
16  
17     return 0;
18 } 


在80X86CPU平台上,执行该程序得到如下结果:
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果,在80X86平台上,系统将多字节中的低位存储在变量起始地址,使用小端法。htonl将i_num转换成网络字节序,可见网络字节序是大端法。

二.判断大小端序

测试:

 1 #include <iostream>
 2 using namespace std;
 3 
 4 int main(int argc, char **argv)
 5 {
 6     short s = 0x0102;
 7     if((*(unsigned char*)&s) == 2)
 8         cout<<"little endian"<<endl;
 9     else if((*(unsigned char*)&s) == 1)
10         cout<<"big endian"<<endl;
11     else
12         cout<<"unknown endian\n"<<endl;
13  
14     return 0;
15 }
请写一个C函数,若处理器是Big_endian的,则返回0;若是Little_endian的,则返回1
int checkCPU( )
{
    {
           union w
           
                  int a;
                  char b;
           } c;
           c.a = 1;
           return(c.b ==1);
    }
}
 
Big-Endian转换成Little-Endian如下:
#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) |
(((uint16)(A) & 0x00ff) << 8))
#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) |
(((uint32)(A) & 0x00ff0000) >> 8) |
(((uint32)(A) & 0x0000ff00) << 8) |
(((uint32)(A) & 0x000000ff) << 24))

三.分析与什么有关系

端模式(Endian)的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类,从圆头开始将鸡蛋敲开的人被归为Big Endian,从尖头开始将鸡蛋敲开的人被归为Littile Endian。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开。在计算机业Big Endian和Little Endian也几乎引起一场战争。在计算机业界,Endian表示数据在存储器中的存放顺序。
PowerPC处理器主导网络市场,可以说绝大多数的通信设备都使用PowerPC处理器进行协议处理和其他控制信息的处理,这也可能也是在网络上的绝大多数协议都采用大端编址方式的原因。因此在有关网络协议的软件设计中,使用小端方式的处理器需要在软件中处理端模式的转变。而Pentium主导个人机市场,因此多数用于个人机的外设都采用小端模式,包括一些在网络设备中使用的PCI总线,Flash等设备,这也要求硬件工程师在硬件设计中注意端模式的转换。
使用大小端的处理器
常用的X86结构是小端模 式,而C51单片机则为大端模式(8位的51没有大小端之说,但Keil C51编译器是大端的)。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。SPARC处理器为大端处理器。
采用大端方式进行数据存放符合人类的正常思维,而采用小端方式进行数据存放利于计算机处理。到目前为止,采用大端或者小端进行数据存放,其孰优孰劣也没有定论。因此在一个处理器系统中,有可能存在大端和小端模式同时存在的现象。这一现象为系统的软硬件设计带来了不小的麻烦,这要求系统设计工程师,必须深入理解大端和小端模式的差别。大端与小端模式的差别体现在一个处理器的寄存器,指令集,系统总线等各个层次中。

### 大端小端的区别 大端(Big Endian)小端(Little Endian)是两种不同的字节序存储方式,用于描述多字节数值在内存中的存储顺序。它们的核心区别在于高位字节低位字节在内存中的排列方式。 - **大端**:高位字节存储在低地址中,低位字节存储在高地址中。这种方式类似于人类书写数字的习惯,例如将一个32位整数`0x12345678`存储为`12 34 56 78`,其中最高位的`0x12`位于最低地址。 - **小端**:低位字节存储在低地址中,高位字节存储在高地址中。这种方式在计算机内部处理时更高效,例如同样的数值`0x12345678`会被存储为`78 56 34 12`,其中最低位的`0x78`位于最低地址[^2]。 ### 在计算机系统中的使用 大端小端存储模式的选择对计算机系统的硬件架构、操作系统以及应用程序开发都有深远影响。以下是一些典型的应用场景: - **处理器架构**:不同的处理器采用不同的字节序。例如,Intel 的 x86 架构采用小端模式,而 IBM Oracle 的某些系统使用大端模式。此外,一些现代处理器如 ARM 支持双端模式,但实际运行的操作系统通常只选择一种模式,如 Android iOS 只支持小端模式。 - **网络协议**:在网络通信中,TCP/IP 协议族统一使用大端模式作为标准字节序,以确保不同平台之间的数据一致性。因此,当主机使用小端模式时,在发送数据前需要将数据换为大端模式,接收方则需进行相应的逆换[^1]。 - **嵌入式系统与PLC**:在可编程逻辑控制器(PLC)嵌入式系统中,理解字节序对于数据交换设备间通信至关重要。由于这些系统可能涉及多种硬件平台,开发者必须注意字节序差异,以避免数据解析错误[^1]。 - **文件格式与跨平台兼容性**:某些文件格式(如图像或音频文件)规定了特定的字节序,以确保跨平台的一致性。例如,PNG 图像格式要求使用大端模式存储多字节数值。开发人员在读写此类文件时需要注意字节序换问题[^3]。 ### 示例代码 以下是一个简单的 C 语言示例,展示如何检测当前系统的字节序: ```c #include <stdio.h> int main() { unsigned int num = 0x12345678; unsigned char *ptr = (unsigned char *)&num; if (*ptr == 0x78) { printf("小端模式\n"); } else if (*ptr == 0x12) { printf("大端模式\n"); } else { printf("未知字节序\n"); } return 0; } ``` 上述代码通过检查变量 `num` 的第一个字节来判断系统的字节序。如果第一个字节是 `0x78`,说明系统使用小端模式;如果是 `0x12`,则是大端模式[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值