关于struct的内存地址分配问题

最新推荐文章于 2025-07-31 23:19:41 发布

原创最新推荐文章于 2025-07-31 23:19:41 发布 · 2.2k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#struct #内存地址 #指针

本文探讨了struct在内存中的分配方式，通过实验分析了struct中不同类型的成员变量如何存储。在32位环境下，struct占用12字节，其中short1占用2字节，char1占用4字节，arrshort占用4字节，而enum1作为常量没有内存地址。编译器使用数据对齐策略，使得short1后面填充了2字节以达到4字节对齐。此外，文章还比较了32位和64位环境下，基本数据类型、指针和结构体的内存差异。

一直对内存地址的分配有些疑惑，故做实验研究一下：

先定义一个Struct，里面包含一个enum，一个short，一个char*存放字符串，一个short*存放short数组。

typedef struct MyStruct
{
	enum MyEnum {
		enum1, enum2, enum3, enum4
	};
	short short1;
	char * char1;
	short * arrshort;
}*PtrMyStruct;

之后定义一个类，里面的private成员变量定义该struct，并加入两个简单的方法永远设置和相关显示：

class myClass
{
private:
	MyStruct mystruct;
public:
	myClass();
        ~myClass();
	void setMyStruct();
	void showStructInfo();
};

实现具体函数

void myClass::setMyStruct()
{
	PtrMyStruct ptrmystruct = &mystruct;
	ptrmystruct->char1 = "hello,this is test";
	ptrmystruct->short1 = 125;
	ptrmystruct->arrshort = new short[4]{4, 32, 21, 57};

};

void myClass::showStructInfo()
{
	PtrMyStruct ptrmystruct = &mystruct;
	cout << "sizeof(mystruct):"<<sizeof(mystruct) << endl;
	cout << "sizeof(ptrmystruct):" << sizeof(ptrmystruct) << endl;
	cout << "sizeof(mystruct.enum1):" << sizeof(mystruct.enum1) << endl;
	cout << "sizeof(short *):" << sizeof(short *) << endl;
	cout << "sizeof(short):" << sizeof(short) << endl;
	cout << "sizeof(char *):" << sizeof(char *) << endl;
	cout << "sizeof(char):" << sizeof(char) << endl;
	cout << "&mystruct:" << &mystruct << endl;
	cout << "&ptrmystruct->short1:" << &ptrmystruct->short1 << endl;
	cout << "&mystruct.char1:" << &mystruct.char1 << endl;
	cout << "&mystruct.arrshort:" << &mystruct.arrshort << endl;
	cout << "ptrmystruct->short1:" << ptrmystruct->short1 << endl;
	cout << "ptrmystruct->char1:" << ptrmystruct->char1 << endl;
	cout << "ptrmystruct->arrshort:" << ptrmystruct->arrshort << endl;
	cout << "ptrmystruct->arrshort[0]:" << ptrmystruct->arrshort[0] << endl;
	cout << "ptrmystruct->arrshort[1]:" << ptrmystruct->arrshort[1] << endl;
	cout << "ptrmystruct->arrshort[2]:" << ptrmystruct->arrshort[2] << endl;
	cout << "ptrmystruct->arrshort[3]:" << ptrmystruct->arrshort[3] << endl;
}

在32位编译环境下Debug的结果：

因为是32位，即8字节，因此地址符的寻址路径有8位。

可以看到mystruct占用了12byte，起始地址是004FF6F8，struct中的第一个变量是short1，short类型占用2byte，因此地址是004FF6F8->004FF6F9；第二个变量地址char1，占用了4byte，地址是004FF6FC->004FF6FF，第三个变量arrshort，占用4byte，地址是004FF700->004FF703。那么有两个问题就来了：

一是arrshort数组的首地址是004FF700，直接调用ptrmystruct->arrshort不加取地址符得到的地址是什么？是new short[4]数组首元素的地址吗？

二是004FF6FA、004FF6FB这两个地址被分配给了谁？是嵌套定义在struct里面的enum?但是enum中的数据类型实际就是int，占4byte，为何对不上号？

那么我们来尝试看下arrshort[0]和MyEnum的地址：

第一个疑问与设想的一样，short数组中的每个short占用new出来的2byte，arrshort这个short指针变量的值是该数组首元素的地址，而arrshort的地址在mystruct开辟的12byte空间中的最后4byte。

然而&mystruct.enum1的操作是不合法的，答案显而易见，mystruct.enum1是数值常量=0，没有内存地址，那么常量存在哪里的？事实是数值常量是一个临时变量，它存放在一个随机的临时栈空间地址中，生命周期未知，所以对它取地址没有意义。

那么short1后面的2byte空间的占用究竟是怎么回事？不妨直接手动输入该地址并通过*取得它的值来看看？插入代码：

cout << "after short1:" << *(&ptrmystruct->short1 + 0x00000002) << endl;
cout << "typeid(after short1):" << typeid(*(&ptrmystruct->short1 + 0x00000002)).name() << endl;

看一下输出结果：

经多次实验发现该地址被一个固定short值-25808所占，且不受short1取值的影响。所以这个值到底是哪里来的？是系统占位符？

查询资料果然如此，原来编译器为了struct中数据的存储速度，可能会用一种数据对齐的机制增加struct的大小，会根据struct中占用字节数最大的数据类型为标准，不足这个字节数的其他数据类型会自动在之后增加字节。如例子中的最大字节数是4byte，那么short类型的short1之后就会被系统自动填充2byte，至于这个自动填充的值从何而来就不得而知了。

彩蛋...不妨比较一下32位和64位的运行结果：

可以看到基本数据类型char、short、int的字节数在32位和64位的编译环境下是不变的，而指针和结构体，包括指向结构体的指针在64位下的字节数都翻倍了。

首先分析内存地址的位数，32位编译下，寻址空间是2^32byte，我们用16进制表示地址的话可利用的就是16^8byte，所以一个地址占用8byte。64位下，寻址空间是2^64byte,16进制表示是16^16，所以一个地址占用16byte。

其次指针的地址大小，原理不简单，但两句话可以解决问题（参考自：指针变量占用内存的大小）：

1.指针所占用的空间与指针指向的内容和内容的大小无关。

2.32位编译时，指针占4个字节；64位编译时时，指针占8个字节。

正是由于结构体中有指针，所以结构体的所有数据都会被扩展为8byte，所以sizeof(struct)=3*8=24