关于struct的内存地址分配问题

本文探讨了struct在内存中的分配方式,通过实验分析了struct中不同类型的成员变量如何存储。在32位环境下,struct占用12字节,其中short1占用2字节,char1占用4字节,arrshort占用4字节,而enum1作为常量没有内存地址。编译器使用数据对齐策略,使得short1后面填充了2字节以达到4字节对齐。此外,文章还比较了32位和64位环境下,基本数据类型、指针和结构体的内存差异。

一直对内存地址的分配有些疑惑,故做实验研究一下:

先定义一个Struct,里面包含一个enum,一个short,一个char*存放字符串,一个short*存放short数组。

typedef struct MyStruct
{
	enum MyEnum {
		enum1, enum2, enum3, enum4
	};
	short short1;
	char * char1;
	short * arrshort;
}*PtrMyStruct;

之后定义一个类,里面的private成员变量定义该struct,并加入两个简单的方法永远设置和相关显示:

class myClass
{
private:
	MyStruct mystruct;
public:
	myClass();
        ~myClass();
	void setMyStruct();
	void showStructInfo();
};

实现具体函数

void myClass::setMyStruct()
{
	PtrMyStruct ptrmystruct = &mystruct;
	ptrmystruct->char1 = "hello,this is test";
	ptrmystruct->short1 = 125;
	ptrmystruct->arrshort = new short[4]{4, 32, 21, 57};

};

void myClass::showStructInfo()
{
	PtrMyStruct ptrmystruct = &mystruct;
	cout << "sizeof(mystruct):"<<sizeof(mystruct) << endl;
	cout << "sizeof(ptrmystruct):" << sizeof(ptrmystruct) << endl;
	cout << "sizeof(mystruct.enum1):" << sizeof(mystruct.enum1) << endl;
	cout << "sizeof(short *):" << sizeof(short *) << endl;
	cout << "sizeof(short):" << sizeof(short) << endl;
	cout << "sizeof(char *):" << sizeof(char *) << endl;
	cout << "sizeof(char):" << sizeof(char) << endl;
	cout << "&mystruct:" << &mystruct << endl;
	cout << "&ptrmystruct->short1:" << &ptrmystruct->short1 << endl;
	cout << "&mystruct.char1:" << &mystruct.char1 << endl;
	cout << "&mystruct.arrshort:" << &mystruct.arrshort << endl;
	cout << "ptrmystruct->short1:" << ptrmystruct->short1 << endl;
	cout << "ptrmystruct->char1:" << ptrmystruct->char1 << endl;
	cout << "ptrmystruct->arrshort:" << ptrmystruct->arrshort << endl;
	cout << "ptrmystruct->arrshort[0]:" << ptrmystruct->arrshort[0] << endl;
	cout << "ptrmystruct->arrshort[1]:" << ptrmystruct->arrshort[1] << endl;
	cout << "ptrmystruct->arrshort[2]:" << ptrmystruct->arrshort[2] << endl;
	cout << "ptrmystruct->arrshort[3]:" << ptrmystruct->arrshort[3] << endl;
}

在32位编译环境下Debug的结果:

因为是32位,即8字节,因此地址符的寻址路径有8位。

可以看到mystruct占用了12byte,起始地址是004FF6F8,struct中的第一个变量是short1,short类型占用2byte,因此地址是004FF6F8->004FF6F9;第二个变量地址char1,占用了4byte,地址是004FF6FC->004FF6FF,第三个变量arrshort,占用4byte,地址是004FF700->004FF703。那么有两个问题就来了:

一是arrshort数组的首地址是004FF700,直接调用ptrmystruct->arrshort不加取地址符得到的地址是什么?是new short[4]数组首元素的地址吗?

二是004FF6FA、004FF6FB这两个地址被分配给了谁?是嵌套定义在struct里面的enum?但是enum中的数据类型实际就是int,占4byte,为何对不上号?

那么我们来尝试看下arrshort[0]和MyEnum的地址:

第一个疑问与设想的一样,short数组中的每个short占用new出来的2byte,arrshort这个short指针变量的值是该数组首元素的地址,而arrshort的地址在mystruct开辟的12byte空间中的最后4byte。

然而&mystruct.enum1的操作是不合法的,答案显而易见,mystruct.enum1是数值常量=0,没有内存地址,那么常量存在哪里的?事实是数值常量是一个临时变量,它存放在一个随机的临时栈空间地址中,生命周期未知,所以对它取地址没有意义。

那么short1后面的2byte空间的占用究竟是怎么回事?不妨直接手动输入该地址并通过*取得它的值来看看?插入代码:

cout << "after short1:" << *(&ptrmystruct->short1 + 0x00000002) << endl;
cout << "typeid(after short1):" << typeid(*(&ptrmystruct->short1 + 0x00000002)).name() << endl;

看一下输出结果:

经多次实验发现该地址被一个固定short值-25808所占,且不受short1取值的影响。所以这个值到底是哪里来的?是系统占位符?

查询资料果然如此,原来编译器为了struct中数据的存储速度,可能会用一种数据对齐的机制增加struct的大小,会根据struct中占用字节数最大的数据类型为标准,不足这个字节数的其他数据类型会自动在之后增加字节。如例子中的最大字节数是4byte,那么short类型的short1之后就会被系统自动填充2byte,至于这个自动填充的值从何而来就不得而知了。

 

彩蛋...不妨比较一下32位和64位的运行结果:

可以看到基本数据类型char、short、int的字节数在32位和64位的编译环境下是不变的,而指针和结构体,包括指向结构体的指针在64位下的字节数都翻倍了。

首先分析内存地址的位数,32位编译下,寻址空间是2^32byte,我们用16进制表示地址的话可利用的就是16^8byte,所以一个地址占用8byte。64位下,寻址空间是2^64byte,16进制表示是16^16,所以一个地址占用16byte。

其次指针的地址大小,原理不简单,但两句话可以解决问题(参考自:指针变量占用内存的大小):

1.指针所占用的空间与指针指向的内容和内容的大小无关。

2.32位编译时,指针占4个字节;64位编译时时,指针占8个字节。

正是由于结构体中有指针,所以结构体的所有数据都会被扩展为8byte,所以sizeof(struct)=3*8=24

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值