结构体对齐、char*str/char str[] 问题
1.结构体对齐的问题(32位下)
1.1结构体字节对齐问题
看下面代码:
#include <stdio.h>
#include <string.h>
struct {
short a1;
short a2;
short a3;
}A;
struct{
long a1;
short a2;
}B;
int main(int argc, const char *argv[])
{
printf("%d %d \n",sizeof(A),sizeof(B));
return 0;
}
结果为:
linux@ubuntu:~/pukun/IOprocess$ ./a.out
6 8
按正常内存分配,结构体B的long(4字节)+short(2字节)应该为6字节,结果显示为8字节;why?
许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的起始地址的值是某个数k的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数;一般来说,结构体的对齐规则是先按数据类型自身进行对齐,然后再按整个结构体进行对齐,对齐值必须是2的幂,比如1,2, 4, 8, 16。如果一个类型按n字节对齐,那么该类型的变量起始地址必须是n的倍数。
整个结构体的对齐值一般是结构体中最大数据类型所占的空间
下面通过一道题来说明:
#include <iostream.h>
#pragma pack(8)
struct example1
{
short a;
long b;
};
struct example2
{
char c;
example1 struct1;
short e;
};
#pragma pack()
int main(int argc, char* argv[])
{
example2 struct2;
cout << sizeof(example1) << endl;
cout << sizeof(example2) << endl;
cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2) << endl;
return 0;
}
结果为: 8 16 4 -----------------why?
1.1.1 自然对界
对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个成员按其自然对界条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
自然对界即默认对齐方式,是指按结构体的成员中size最大的成员对齐。
列如:
struct test1
{
char a;
short b;
char c;
};
在上述结构体中,size最大的是short,其长度为2字节,因而结构体中的char成员a、c都以2为单位对齐,sizeof(test1的结果等于6;
如果改为:
struct test2
{
char a;
int b;
char c;
};
其结果显然为12。
1.1.2指定对界
一般地,可以通过下面的方法来改变缺省的对界条件:
· 使用伪指令#pragma pack (n),编译器将按照n个字节对齐;
· 使用伪指令#pragma pack (),取消自定义字节对齐方式。
注意:如果#pragma pack (n)中指定的n大于结构体中最大成员的size,则其不起作用,结构体仍然按照size最大的成员进行对界。
至此,上面题就能解释:
程序中#pragma pack (8)虽然指定了对界为8,但是由于struct example1中的成员最大size为4(long变量size为4),故struct example1仍然按4字节对界,struct example1的size为8;
struct example2中包含了struct example1,其本身包含的简单数据成员的最大size为2(short变量e),但是因为其包含了struct example1,而struct example1中的最大成员size为4,struct example2也应以4对界,#pragma pack (8)中指定的对界对struct example2也不起作用,故输出结果为16;
由于struct example2中的成员以4为单位对界,故其char变量c后应补充3个空,其后才是成员struct1的内存空间,输出结果为4。
1.2对于结构体字节的解释,例如:
struct Size2{
char c1; //下一个大小为4,偏移应该可以整除4,所以会填充3个字节
int i1; //下一个大小为4,上边的4加上int的大小4,所以这个偏移可以。占4
float f; //下一个大小为8,当前正常偏移为12,不可以整除8,所以填充4位,偏移为16
double d1; //占8个字节
}; //最后整体偏移为24,可以整除8。
2.char*str/char str[] 问题
有如下三种情况:
1.char *str1 = "hello";
2.char *str2 = "hello";
3.char str2[] = "hello";
这三种情况有何区别?
1.char *str1/2=“hello”
1."hello"存于字符常量区,第1、2种情况表示将字符常量区的hello的首地址赋值给str1、str2;不同的是这个常量区不能通过指针来赋值修改;
2.双引号引起来的字符串都保存在字符常量区,如果字符串一样,就是同一块内存空间,即str1和str2里的地址一样,字符串不一样,就是不同的内存空间;
3.第3种表示将字符常量区的hello拷贝到str2数组中,能修改,类似strcpy;
例如:
#include <stdio.h>
int main(int argc, const char *argv[])
{
char *str1 = "hello";
char *str2 = "hello";
char str3[]="hello";
printf("%p %p\n ",str1,str2);
printf("%p %p\n ",&str1,&str2);
printf("%p %p\n ",str1,str3);
return 0;
}
结果如下:
0x80485b0 0x80485b0//打印输出的str1和str2的内容的地址一样
0xbffafbdc 0xbffafbe0//str1和str2空间的地址不同,即说明str1和str2不同地址存放的是同一个常量区的地址
0x80485b0 0xbffafbe6//str3即说明内容的地址与常量区的不同,相当于拷贝
本文详细解析了结构体字节对齐原则,包括自然对界与指定对界的运用,以及char*str与char str[]的区别。通过实例代码演示了不同对齐方式对结构体大小的影响,并解释了字符串在不同声明方式下的存储与访问特性。

555





