大小端及堆栈增长——测试方法
在各种计算机体系结构中,对于字节、字等的存储机制有所不同,因而引发了计算机通信领域中一个很重要的问题,即通信双方交流的信息单元(比特、字节、字、双字等等)应该以什么样的顺序进行传送。目前在各种体系的计算机中通常采用的字节存储机制主要有两种:Big-Endian和Little-Endian.。
大小端字节序
字节序,即多字节类型的数据在内存中的存放顺序,在跨平台和网络程序中字节序是常被考虑的问题。
- Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
- Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
- 网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序。
C程序映像中内存的空间布局情况大致如下:
在内存分布中,栈是向下增长的,而堆是向上增长的。如果我们在栈上分配一个unsigned char buf[4],那么这个数组变量在栈上的布局如下:
以unsigned int value = 0x12345678为例,从高位到低位的字节依次是0x12、0x34、0x56和0x78,用unsigned char buf[4]来表示value,分别看看在两种字节序下其存储情况:
采用 Little-endian模式的CPU对操作数的存放方式是从低字节到高字节,而Big-endian模式对操作数的存放方式是从高字节到低字节。 32bit宽的数0x12345678在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 | 0x4000 | 0x4001 | 0x4002 | 0x4003 |
---|---|---|---|---|
存放内容 | 0x78 | 0x56 | 0x34 | 0x12 |
而在Big- endian模式CPU内存中的存放方式则为:
内存地址 | 0x4000 | 0x4001 | 0x4002 | 0x4003 |
---|---|---|---|---|
存放内容 | 0x12 | 0x34 | 0x56 | 0x78 |
- 采用Big-Endian机制的处理器有IBM3700系列、PDP-10、Mortolora微处理器系列和绝大多数的RISC处理器。
- 采用Little-Endian机制的处理器有PDP-11、VAX、Intel系列微处理器和一些网络通信设备。该术语除了描述多字节存储顺序外还常常用来描述一个字节中各个比特的排放次序。
Big-Endian和Little-Endian优缺点
-
Big-Endian优点:靠首先提取高位字节,你总是可以由看看在偏移位置为0的字节来确定这个数字是正数还是负数。你不必知道这个数值有多长,或者你也不必过一些字节来看这个数值是否含有符号位。这个数值是以它们被打印出来的顺序存放的,所以从二进制到十进制的函数特别有效。因而,对于不同要求的机器,在设计存取方式时就会不同。
-
Little-Endian优点:提取一个,两个,四个或者更长字节数据的汇编指令以与其他所有格式相同的方式进行:首先在偏移地址为0的地方提取最低位的字节,因为地址偏移和字节数是一对一的关系,多重精度的数学函数就相对地容易写了。如果你增加数字的值,你可能在左边增加数字(高位非指数函数需要更多的数字)。 因此, 经常需要增加两位数字并移动存储器里所有Big-endian顺序的数字,把所有数向右移,这会增加计算机的工作量。不过,使用Little- Endian的存储器中不重要的字节可以存在它原来的位置,新的数可以存在它的右边的高位地址里。这就意味着计算机中的某些计算可以变得更加简单和快速。
这里提供了两种常用的大小端测试方法:
void EndianTest(void)
{
unsigned int i = 0x12345678;
unsigned char *c = (unsigned char *)&i;
union{
unsigned int union_i;
unsigned char union_c[4];
}un;
un.union_i = 0x12345678;
printf("EndianTest begin-----------------------------------------------\n");
printf("-----------------------first. union way\n");
printf("un.union_i is: %x \n" , un.union_i);
printf("un.union_c[0] is: %x \n" , un.union_c[0]);
printf("un.union_c[4] is: %x \n" , un.union_c[4]);
printf("%s\n", (0x12 == un.union_c[0]) ? "big endian" : "little endian");
printf("--------------------second. address way\n");
printf("i is: %x \n" , i);
printf("*c is: %x \n" , *c);
printf("*(c+1) is: %x \n" , *(c+1));
printf("%s\n", (*c == 0x12) ? "big endian" : "little endian");
printf("EndianTest end--------------------------------------------------\n\n");
}
Qt5测试运行结果如下:
下面的代码是实现大端和小端整数的转换:
int chgendian(int x)
{
int x2=0;
char *p=(char*)&x;
int i = sizeof(int)-1;
while(i>=0)
{
x2|=*p<<(i*8);
i--;
p++;
}
return x2;
}
获取堆栈增长方向的巧妙方法
网上发现一个用C语言实现,获取堆栈增长方向的巧妙方法,实现代码:
static void find_stack_direction ()
{
static char *addr = NULL; /* Address of first `dummy', once known. */
auto char dummy; /* To get stack address. */
if (addr == NULL)
{ /* Initial entry. */
addr = ADDRESS_FUNCTION (dummy);
find_stack_direction (); /* Recurse once. */
}
else
{
/* Second entry. */
if (ADDRESS_FUNCTION (dummy) > addr)
stack_dir = 1; /* Stack grew upward. */
else
stack_dir = -1; /* Stack grew downward. */
}
}
简化后的相关定义:
static int stack_dir; /* 1 or -1 once known. */
#define ADDRESS_FUNCTION(arg) &(arg)
find_stack_direction函数使用函数递归的方法
第一次进入,由于addr为NULL,所以将字符变量dummy的地址赋值给静态变量addr
第二次进入,由于静态变量addr已赋了值,所以进入 “Second entry.”
接着,将第二次进入的dummy地址和第一次进入的dummy地址相比较
如果值为正,则堆栈向高地址增长;否则,堆栈向低地址增长
巧妙地运用了“函数递归也使用了堆栈”的思想.