大端法、小端法、网络字节序转

最新推荐文章于 2021-04-05 09:54:45 发布

转载最新推荐文章于 2021-04-05 09:54:45 发布 · 967 阅读

c++ 专栏收录该内容

29 篇文章

订阅专栏

本文详细介绍了字节序的概念、定义及其与网络字节序的区别，通过C语言实例展示了如何在不同平台下判断字节序，并提供了大小端转换的实现方法，有助于理解数据在内存中的存储顺序及其在网络传输过程中的处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大端法、小端法、网络字节序转

一.概念、定义

关于字节序(大端法、小端法)的定义

《UNXI网络编程》定义：术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址，即是小端字节序；大端存在起始地址，即是大端字节序。

也可以说：
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址，高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址，低位字节排放在内存的高地址端。

举个简单的例子，对于整形0x12345678。它在大端法和小端法的系统内中，分别如图1所示的方式存放。

网络字节序

我们知道网络上的数据流是字节流，对于一个多字节数值，在进行网络传输的时候，先传递哪个字节？也就是说，当接收端收到第一个字节的时候，它是将这个字节作为高位还是低位来处理呢？
网络字节序定义：收到的第一个字节被当作高位看待，这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时，发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前，在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形，在80X86平台中，它是以小端法存放的，在发送前需要使用系统提供的htonl将其转换成大端法存放，如图2所示。

字节序测试程序

不同cpu平台上字节序通常也不一样，下面写个简单的C程序，它可以测试不同平台上的字节序。

 
 1 #include <stdio.h>
2 #include <netinet/in.h>
3 int main()
4 {
5     int i_num = 0x12345678;
6     printf("[0]:0x%x\n", *((char *)&i_num + 0));
7     printf("[1]:0x%x\n", *((char *)&i_num + 1));
8     printf("[2]:0x%x\n", *((char *)&i_num + 2));
9     printf("[3]:0x%x\n", *((char *)&i_num + 3));
10  
11     i_num = htonl(i_num);
12     printf("[0]:0x%x\n", *((char *)&i_num + 0));
13     printf("[1]:0x%x\n", *((char *)&i_num + 1));
14     printf("[2]:0x%x\n", *((char *)&i_num + 2));
15     printf("[3]:0x%x\n", *((char *)&i_num + 3));
16  
17     return 0;
18 } 
 

在80X86CPU平台上，执行该程序得到如下结果：
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果，在80X86平台上，系统将多字节中的低位存储在变量起始地址，使用小端法。htonl将i_num转换成网络字节序，可见网络字节序是大端法。

二.判断大小端序

测试：

 1 #include <iostream>
 2 using namespace std;
 3 
 4 int main(int argc, char **argv)
 5 {
 6     short s = 0x0102;
 7     if((*(unsigned char*)&s) == 2)
 8         cout<<"little endian"<<endl;
 9     else if((*(unsigned char*)&s) == 1)
10         cout<<"big endian"<<endl;
11     else
12         cout<<"unknown endian\n"<<endl;
13  
14     return 0;
15 }

请写一个C函数，若处理器是Big_endian的，则返回0；若是Little_endian的，则返回1

int checkCPU( )

{

union w

{

int a;

char b;

} c;

c.a = 1;

return(c.b ==1);

}

Big-Endian转换成Little-Endian如下：
#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) |
(((uint16)(A) & 0x00ff) << 8))
#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) |
(((uint32)(A) & 0x00ff0000) >> 8) |
(((uint32)(A) & 0x0000ff00) << 8) |
(((uint32)(A) & 0x000000ff) << 24))

三.分析与什么有关系

端模式（Endian）的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类，从圆头开始将鸡蛋敲开的人被归为Big Endian，从尖头开始将鸡蛋敲开的人被归为Littile Endian。小人国的内战就源于吃鸡蛋时是究竟从大头（Big-Endian）敲开还是从小头（Little-Endian）敲开。在计算机业Big Endian和Little Endian也几乎引起一场战争。在计算机业界，Endian表示数据在存储器中的存放顺序。
PowerPC处理器主导网络市场，可以说绝大多数的通信设备都使用PowerPC处理器进行协议处理和其他控制信息的处理，这也可能也是在网络上的绝大多数协议都采用大端编址方式的原因。因此在有关网络协议的软件设计中，使用小端方式的处理器需要在软件中处理端模式的转变。而Pentium主导个人机市场，因此多数用于个人机的外设都采用小端模式，包括一些在网络设备中使用的PCI总线，Flash等设备，这也要求硬件工程师在硬件设计中注意端模式的转换。
使用大小端的处理器
常用的X86结构是小端模式，而C51单片机则为大端模式（8位的51没有大小端之说，但Keil C51编译器是大端的）。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。SPARC处理器为大端处理器。
采用大端方式进行数据存放符合人类的正常思维，而采用小端方式进行数据存放利于计算机处理。到目前为止，采用大端或者小端进行数据存放，其孰优孰劣也没有定论。因此在一个处理器系统中，有可能存在大端和小端模式同时存在的现象。这一现象为系统的软硬件设计带来了不小的麻烦，这要求系统设计工程师，必须深入理解大端和小端模式的差别。大端与小端模式的差别体现在一个处理器的寄存器，指令集，系统总线等各个层次中。

1	#include <stdio.h>
2	#include <netinet/in.h>
3	int main()
4	{
5	int i_num = 0x12345678;
6	printf("[0]:0x%x\n", ((char )&i_num + 0));
7	printf("[1]:0x%x\n", ((char )&i_num + 1));
8	printf("[2]:0x%x\n", ((char )&i_num + 2));
9	printf("[3]:0x%x\n", ((char )&i_num + 3));
10
11	i_num = htonl(i_num);
12	printf("[0]:0x%x\n", ((char )&i_num + 0));
13	printf("[1]:0x%x\n", ((char )&i_num + 1));
14	printf("[2]:0x%x\n", ((char )&i_num + 2));
15	printf("[3]:0x%x\n", ((char )&i_num + 3));
16
17	return 0;
18	}

大端法、小端法、网络字节序 转

大端法、小端法、网络字节序转