01 大端小端

本文深入探讨了计算机存储数据的大端和小端方式,详细解释了它们在内存上的存储区别,以及在网络传输中的作用。通过两个实验演示了如何确定本机的存储方式,并介绍了在不同存储方式间转换的方法。

计算机存储数据是按大端或者小端将数据保存在内存上. 一般处理器都只选择其中的一种, 通常intelAMD处理器都是采用小端存储方式, 也有一些处理器是采用大端方式, 如果IBM公司的处理器.

小端储存 :

0x10030x78
0x10020x56
0x10010x34
0x10000x12

大端储存 :

0x10030x12
0x10020x34
0x10010x56
0x10000x78

大端跟小端存储数据的方式就不一样. 比如像0x12345678, 在两种方式的储存如上. 小端 : 将高字节放在高位, 低字节放在低位. 大端 : 将高字节放在低位, 低字节放在高位. 如果我们在传输数据的时候如果小端处理器传送给大端处理器, 那么在接收数据后都无法辨认数据究竟是什么, 所以为了保证数据可以在不同的存储方式上都能够被正确的接收, 规定网络传输是大端传输, 当数据接收到本地时再根据处理器储存数据的方式进行转化, 这样就保证接收后不会数据无法辨认.


验证本机的存储方式

大端还是小端的验证有很多种方法, 这里就简单的用两种方式来验证.


实验一

大端跟小端是在储存数据的方式上不一样, 就像0x12345678, 我们将其中的低字节取出来查看是0x12还是0x78就可以验证本机的使用的是小端还是大端了.

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
	int i = 0x12345678;
	char ch = *(char *)&i;

	if(ch == 0x78)
		printf("小端\n");
	else
		printf("大端\n");
 
    exit(EXIT_SUCCESS);
}

我的电脑验证的是小端.


实验二

我们也可以用union来验证, 原理与上面一样的, 只是运用了union本身就是直接共用储存空间的.

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

union tmp
{
    int i;
    char ch;
};

int main(int argc, char *argv[])
{
	union tmp t;
	t.i = 0x12345678;


	if(t.ch == 0x78)
		printf("小端\n");
	else
		printf("大端\n");
 
    exit(EXIT_SUCCESS);
}

大端和小端之间的转换

在网络编程中, 可以使用以下4个函数对数据在大小端之间进行转换.

#include <apra/inet.h>
	
uint32_t htonl(uint32_t);	// 本机字节转为网络字节(32位)
uint32_t ntohl(uint32_t);	// 网络字节转为本机字节(32位)

uint16_t htons(uint16_t);	// 本机字节转为网络字节(16位)
uint16_t ntohs(uint16_t);	// 网络字节转为本机字节(16位)

网络字节是大端方式. 上面函数的可以这样记 : h表示host(本机), n表示network(网络), to转换, l长字节, s短字节.

可以使用验证一下 :

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <arpa/inet.h>

int main(int argc, char *argv[])
{
	uint32_t l = 0x12345678;
	uint32_t ll = htonl(l);
	printf("ll = %x, l = %x\n", ll, l);	// ll = 78563412, l = 12345678
 
    exit(EXIT_SUCCESS);
}

完整代码 : 大端小端


总结

这里仅仅用简单的例子验证本机的大小端, 重点明白

  • 大端, 小端的区别
  • 网络字节是大端
### 大端的定义 大端(Big-Endian)和小(Little-Endian)描述了多字节数据在内存中存储的字节顺序。大端模式下,高位字节排放在内存的低地址,低位字节排放在内存的高地址;小模式下,低位字节排放在内存的低地址,高位字节排放在内存的高地址。例如,对于十六进制数 0x12345678,在大端模式下内存排列为 0x12 0x34 0x56 0x78,在小模式下内存排列为 0x78 0x56 0x34 0x12 [^1][^4]。 ### 大端的起源 “endian”一词来源于十八世纪爱尔兰作家乔纳森·斯威夫特(Jonathan Swift)的小说《格列佛游记》(Gulliver’s Travels)。小说中,小人国为水煮蛋该从大的一(Big-End)剥开还是小的一(Little-End)剥开而争论,争论的双方分别被称为“大端派(Big-Endians)”和“小派(Little-Endians)” [^3]。 ### 判断大端的方法 可以使用共用体来判断系统的字节序。如下例子,共用体 `endian_test` 具有 `short`(2Byte)和长度为 2 的 `char` 数组(2Byte)这 2 个成员。在 `main` 函数中,将整数值 0x0102 赋值给 `value`,然后通过检查 `bytes` 数组的值来判断大端类型。 如果以 0x01、0x02 的方式存储,则为大端。如果以 0x02、0x01 的方式存储,则为小 [^2]。 ```c #include <stdio.h> union endian_test { short value; char bytes[sizeof(short)]; }; int main() { union endian_test test; test.value = 0x0102; if (test.bytes[0] == 0x01 && test.bytes[1] == 0x02) { printf("Big endian\n"); } else if (test.bytes[0] == 0x02 && test.bytes[1] == 0x01) { printf("Little endian\n"); } else { printf("Unknown endian\n"); } return 0; } ``` ### 大端在编程中的处理 在网络编程中,由于不同的系统可能采用不同的字节序,因此需要进行字节序的转换。例如在 Socket 编程中,对 `BitConverter.IsLittleEndian` 进行判断,如果不是小则将字节数组进行反转转化为小 [^5]。 ```csharp //点击发送按钮 public void Send() { string sendStr = InputFeld.text; //组装协议 byte[] bodyBytes = System.Text.Encoding.Default.GetBytes(sendStr); Int16 len = (Int16)bodyBytes.Length; byte[] lenBytes = BitConverter.GetBytes(len); //大小编码 if(! BitConverter.IsLittleEndian){ Debug.Log("[Send] Reverse lenBytes"); lenBytes.Reverse(); } //拼接字节 byte[] sendBytes = lenBytes.Concat(bodyBytes).ToArray(); socket.Send(sendBytes); } ``` ### 大端的应用场景 - **硬件层面**:不同的处理器架构可能采用不同的字节序,如 x86 架构采用小字节序,而 PowerPC 架构采用大端字节序。 - **网络通信**:网络协议通常规定使用大端字节序(也称为网络字节序),因此在进行网络数据传输时,需要将主机字节序转换为网络字节序,接收数据时再将网络字节序转换为主机字节序。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值