大端和小端(Big endian and Little endian)

本文详细解析了大端和小端存储方式的概念及其在不同处理器架构中的应用,并提供了多种检测和转换方法,同时通过具体实例加深理解。

一、大端和小端的问题

对于整型、长整型等数据类型,Big endian 认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节);而 Little endian 则相反,它认为第一个字节是最低位字节(按照从低地址到高地址的顺序存放据的低位字节到高位字节)。

例如,假设从内存地址 0x0000 开始有以下数据:  
0x0000         0x0001       0x0002       0x0003  
0x12            0x34           0xab           0xcd 
如果我们去读取一个地址为 0x0000 的四个字节变量,若字节序为big-endian,则读出结果为0x1234abcd;若字节序为little-endian,则读出结果为0xcdab3412。

如果我们将0x1234abcd 写入到以 0x0000 开始的内存中,则Little endian 和 Big endian 模式的存放结果如下:  
地址           0x0000         0x0001        0x0002          0x0003 
big-endian   0x12           0x34            0xab            0xcd  
little-endian  0xcd           0xab            0x34            0x12

一般来说,x86 系列 CPU 都是 little-endian 的字节序,PowerPC 通常是 big-endian,网络字节顺序也是 big-endian还有的CPU 能通过跳线来设置 CPU 工作于 Little endian 还是 Big endian 模式。

对于0x12345678的存储:

小端模式:(从低字节到高字节)
地位地址 0x78 0x56 0x34 0x12 高位地址

大端模式:(从高字节到低字节)
地位地址 0x12 0x34 0x56 0x78 高位地址

二、大端小端转换方法

htonl() htons() 从主机字节顺序转换成网络字节顺序
ntohl() ntohs() 从网络字节顺序转换为主机字节顺序

Big-Endian转换成Little-Endian

#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) | (((uint16)(A) & 0x00ff) << 8))
#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) | (((uint32)(A) & 0x00ff0000) >> 8) | \
             (((uint32)(A) & 0x0000ff00) << 8) | (((uint32)(A) & 0x000000ff) << 24))

三、大端小端检测方法

如何检查处理器是big-endian还是little-endian?

C程序:

    int i = 1;   
    char *p = (char *)&i;   
    if(*p == 1)     
          printf("Little Endian"); 
    else
          printf("Big Endian");

    大小端存储问题,如果小端方式中(i占至少两个字节的长度)则i所分配的内存最小地址那个字节中就存着1,其他字节是0.大端的话则1在i的最高地址字节处存放,char是一个字节,所以强制将char型量p指向i则p指向的一定是i的最低地址,那么就可以判断p中的值是不是1来确定是不是小端。

  联合体union的存放顺序是所有成员都从低地址开始存放,利用该特性就可以轻松地获得了CPU对内存采用Little-endian还是Big-endian模式读写。

复制代码
/*return 1: little-endian, return 0: big-endian*/
int checkCPUendian()
{
  union
  {
    unsigned int a;
    unsigned char b; 
  }c;
  c.a = 1;
  return (c.b == 1); 
}
复制代码

实现同样的功能,来看看Linux 操作系统中相关的源代码是怎么做的:

static union { char c[4]; unsigned long mylong; } endian_test = {{ 'l', '?', '?', 'b' } };

#define ENDIANNESS ((char)endian_test.mylong)

Linux 的内核作者们仅仅用一个union 变量和一个简单的宏定义就实现了一大段代码同样的功能!(如果ENDIANNESS=’l’表示系统为little endian,为’b’表示big endian)

四、一些笔试题目

  char *sz = "0123456789"; 
  int *p = (int*)sz; 
  printf("%x\n",*++p); 

字符'0'对应的十六进制是0x30,请问在x86环境下程序输出是多少?

假设字符串sz地址从@0开始,那么sz在内存的存储为 
@0   @1   @2   @3   @4   @5   @6   @7   @8   @9 
0x30 0x31 0x32 0x33 0x34 0x35 0x36 0x37 0x38 0x39 
当你把char*强制类型转化成int*后,因为int占四个字节,那么p指向@0,并且*p占有的地址是@0@1@2@3,打印的时候 先进行++p操作,那么p指向@4,此时*p占有的地址是@4@5@6@7,根据上面地地址存地位,高地址存高位的解释,那么*p应该等于0x37363534

    int a = 0x12345678;
    char *p = (char*)(&a);
    printf("%x\n",*(p+1));

例如对于0x12345678,网络字节顺序是这样0x12,0x34,0x56,0x78存储的,这种方式称为big-endian
intel处理器是0x78 0x56 0x34 0x12这样来存储的,称为小尾little-endian
在x86环境下题目中的p指向0x78,加1后指向0x56

复制代码
#include <stdio.h>
union
{
    int i;
    char x[2];
}a;
int main()
{
    a.x[0] = 10;
    a.x[1] = 1;
    printf("%d",a.i);
    return 0;
}
复制代码

x86下输出答案: 266 (x86下:低位低地址,高位高地址,i内存里存的值是Ox010A,十进制为266)

复制代码
int main()
{
    union
    {
        int i;
        struct
        {
            char first;
            char second;
        }half;
    }number;
    number.i=0x4241;
    printf("%c %c\n", number.half.first, number.half.second);
    number.half.first='a';
    number.half.second='b';
    printf("%x\n", number.i);
    return 0;
}
复制代码

x86下输出答案:
       A B   (0x41对应'A',是低位;Ox42对应'B',是高位)
       6261 (number.i和number.half共用一块地址空间0x6261)

<think>嗯,用户想了解大端小端节序的区别及工作原理。首先,我需要回忆一下相关知识。大端节序是高在低地址,低在高地址,对吧?而小端则相反,低在低地址,高在高地址。比如,数0x12345678大端存储的话,内从低到高是12345678小端就是78563412。然后,工作原理方面,计算机内部处理多用小端,因为处理数据从低开始,效率高。比如做加法,先处理低节,这样不需要来回调整顺序。而网络传输文件存储一般用大端,符合人类的读写习惯,也统一标准,避免混乱。 接下来,用户可能想知道为什么会有这两种不同的方式。需要解释计算机处理效率人类习惯之间的权衡。小端序适合CPU处理,大端序适合网络传输。可能还要提到主机节序网络节序的转换,比如htonshtonl函数。 另外,应用场景的区别也很重要。比如,网络协议用大端,x86架构的CPU用小端。可能需要举例不同的处理器架构,比如ARM可以切换,但通常用小端?还要检查引用内容是否符合。用户提供的引用里提到,计算机内部处理是小端,网络传输用大端。引用4详细说明了存储的例子,引用5解释了排列规则。需要确保回答中的例子引用一致。可能用户还会混淆的概念,需要简单区分。比如,是bit,节是8节序关注的是在内中的排列顺序,而不是。最后,生成相关问题的时候,要考虑用户可能的后续疑问,比如如何判断系统是大端还是小端,转换方法,不同架构的影响,以及实际编程中的应用,比如网络编程中的节序转换函数。</think>### 大端节序与小端节序的区别及工作原理 #### 1. **核心区别** - **大端节序(Big-Endian)** 高存储在内的低地址,低存储在高地址。例如,整数 `0x12345678` 的大端存储顺序为: $$ \text{低地址} \rightarrow \text{高地址} : 12\ 34\ 56\ 78 $$ 符合人类从左到右的阅读习惯,常用于网络传输文件存储[^1][^4][^5]。 - **小端节序(Little-Endian)** 低存储在内的低地址,高存储在高地址。例如,同一整数 `0x12345678` 的小端存储顺序为: $$ \text{低地址} \rightarrow \text{高地址} : 78\ 56\ 34\ 12 $$ 与计算机处理数据的逻辑一致(从低开始运算),因此是大多数 CPU 的内部处理方式(如 x86 架构)[^1][^3][^5]。 #### 2. **工作原理** - **计算机处理效率** 小端节序允许 CPU 直接从低地址开始读取数据,无需调整节顺序即可处理低运算(如加法、乘法),提高了计算效率[^1][^5]。 - **网络传输的统一性** 网络协议强制使用大端节序(网络节序),确保不同设备间的数据解析一致。例如,TCP/IP 协议中传输的整数均以大端格式编码[^3][^4]。 #### 3. **应用场景** - **小端节序**: - 主机内部数据处理(如 x86、ARM 架构) - 内密集型操作(如实时图像处理)[^1][^5] - **大端节序**: - 网络协议(如 IP 地址、端口号) - 文件格式(如 PNG、JPEG 的文件头)[^3][^4] #### 4. **示例代码(判断节序)** ```c #include <stdio.h> int main() { int num = 0x12345678; char *p = (char*)# if (*p == 0x78) { printf("小端节序\n"); } else { printf("大端节序\n"); } return 0; } ``` ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值