一直对内存地址的分配有些疑惑,故做实验研究一下:
先定义一个Struct,里面包含一个enum,一个short,一个char*存放字符串,一个short*存放short数组。
typedef struct MyStruct
{
enum MyEnum {
enum1, enum2, enum3, enum4
};
short short1;
char * char1;
short * arrshort;
}*PtrMyStruct;
之后定义一个类,里面的private成员变量定义该struct,并加入两个简单的方法永远设置和相关显示:
class myClass
{
private:
MyStruct mystruct;
public:
myClass();
~myClass();
void setMyStruct();
void showStructInfo();
};
实现具体函数
void myClass::setMyStruct()
{
PtrMyStruct ptrmystruct = &mystruct;
ptrmystruct->char1 = "hello,this is test";
ptrmystruct->short1 = 125;
ptrmystruct->arrshort = new short[4]{4, 32, 21, 57};
};
void myClass::showStructInfo()
{
PtrMyStruct ptrmystruct = &mystruct;
cout << "sizeof(mystruct):"<<sizeof(mystruct) << endl;
cout << "sizeof(ptrmystruct):" << sizeof(ptrmystruct) << endl;
cout << "sizeof(mystruct.enum1):" << sizeof(mystruct.enum1) << endl;
cout << "sizeof(short *):" << sizeof(short *) << endl;
cout << "sizeof(short):" << sizeof(short) << endl;
cout << "sizeof(char *):" << sizeof(char *) << endl;
cout << "sizeof(char):" << sizeof(char) << endl;
cout << "&mystruct:" << &mystruct << endl;
cout << "&ptrmystruct->short1:" << &ptrmystruct->short1 << endl;
cout << "&mystruct.char1:" << &mystruct.char1 << endl;
cout << "&mystruct.arrshort:" << &mystruct.arrshort << endl;
cout << "ptrmystruct->short1:" << ptrmystruct->short1 << endl;
cout << "ptrmystruct->char1:" << ptrmystruct->char1 << endl;
cout << "ptrmystruct->arrshort:" << ptrmystruct->arrshort << endl;
cout << "ptrmystruct->arrshort[0]:" << ptrmystruct->arrshort[0] << endl;
cout << "ptrmystruct->arrshort[1]:" << ptrmystruct->arrshort[1] << endl;
cout << "ptrmystruct->arrshort[2]:" << ptrmystruct->arrshort[2] << endl;
cout << "ptrmystruct->arrshort[3]:" << ptrmystruct->arrshort[3] << endl;
}
在32位编译环境下Debug的结果:

因为是32位,即8字节,因此地址符的寻址路径有8位。
可以看到mystruct占用了12byte,起始地址是004FF6F8,struct中的第一个变量是short1,short类型占用2byte,因此地址是004FF6F8->004FF6F9;第二个变量地址char1,占用了4byte,地址是004FF6FC->004FF6FF,第三个变量arrshort,占用4byte,地址是004FF700->004FF703。那么有两个问题就来了:
一是arrshort数组的首地址是004FF700,直接调用ptrmystruct->arrshort不加取地址符得到的地址是什么?是new short[4]数组首元素的地址吗?
二是004FF6FA、004FF6FB这两个地址被分配给了谁?是嵌套定义在struct里面的enum?但是enum中的数据类型实际就是int,占4byte,为何对不上号?
那么我们来尝试看下arrshort[0]和MyEnum的地址:

第一个疑问与设想的一样,short数组中的每个short占用new出来的2byte,arrshort这个short指针变量的值是该数组首元素的地址,而arrshort的地址在mystruct开辟的12byte空间中的最后4byte。
然而&mystruct.enum1的操作是不合法的,答案显而易见,mystruct.enum1是数值常量=0,没有内存地址,那么常量存在哪里的?事实是数值常量是一个临时变量,它存放在一个随机的临时栈空间地址中,生命周期未知,所以对它取地址没有意义。
那么short1后面的2byte空间的占用究竟是怎么回事?不妨直接手动输入该地址并通过*取得它的值来看看?插入代码:
cout << "after short1:" << *(&ptrmystruct->short1 + 0x00000002) << endl;
cout << "typeid(after short1):" << typeid(*(&ptrmystruct->short1 + 0x00000002)).name() << endl;
看一下输出结果:

经多次实验发现该地址被一个固定short值-25808所占,且不受short1取值的影响。所以这个值到底是哪里来的?是系统占位符?
查询资料果然如此,原来编译器为了struct中数据的存储速度,可能会用一种数据对齐的机制增加struct的大小,会根据struct中占用字节数最大的数据类型为标准,不足这个字节数的其他数据类型会自动在之后增加字节。如例子中的最大字节数是4byte,那么short类型的short1之后就会被系统自动填充2byte,至于这个自动填充的值从何而来就不得而知了。
彩蛋...不妨比较一下32位和64位的运行结果:


可以看到基本数据类型char、short、int的字节数在32位和64位的编译环境下是不变的,而指针和结构体,包括指向结构体的指针在64位下的字节数都翻倍了。
首先分析内存地址的位数,32位编译下,寻址空间是2^32byte,我们用16进制表示地址的话可利用的就是16^8byte,所以一个地址占用8byte。64位下,寻址空间是2^64byte,16进制表示是16^16,所以一个地址占用16byte。
其次指针的地址大小,原理不简单,但两句话可以解决问题(参考自:指针变量占用内存的大小):
1.指针所占用的空间与指针指向的内容和内容的大小无关。
2.32位编译时,指针占4个字节;64位编译时时,指针占8个字节。
正是由于结构体中有指针,所以结构体的所有数据都会被扩展为8byte,所以sizeof(struct)=3*8=24
本文探讨了struct在内存中的分配方式,通过实验分析了struct中不同类型的成员变量如何存储。在32位环境下,struct占用12字节,其中short1占用2字节,char1占用4字节,arrshort占用4字节,而enum1作为常量没有内存地址。编译器使用数据对齐策略,使得short1后面填充了2字节以达到4字节对齐。此外,文章还比较了32位和64位环境下,基本数据类型、指针和结构体的内存差异。
1065

被折叠的 条评论
为什么被折叠?



