1. 定义
sizeof是一个操作符(operator)。
其作用是返回一个对象或类型所占的内存字节数。
2. 语法
sizeof有三种语法形式:
1) sizeof (object); //sizeof (对象)
2) sizeof object; //sizeof 对象
3) sizeof (type_name); //sizeof (类型)
对象可以是各种类型的变量,以及表达式(一般sizeof不会对表达式进行计算)。
sizeof对对象求内存大小,最终都是转换为对对象的数据类型进行求值。
sizeof (表达式); //值为表达式的最终结果的数据类型的大小
举例:
int i;
sizeof(int); //值为4
sizeof(i); //值为4,等价于sizeof(int)
sizeof i; //值为4
sizeof(2); //值为4,等价于sizeof(int),因为2的类型为int
sizeof(2 + 3.14); //值为8,等价于sizeof(double),因为此表达式的结果的类型为double
char ary[sizeof(int) * 10]; //OK,编译无误
1. 基本数据类型的sizeof
这里的基本数据类型是指short、int、long、float、double这样的简单内置数据类型。
由于它们的内存大小是和系统相关的,所以在不同的系统下取值可能不同。
2. 结构体的sizeof
结构体的sizeof涉及到字节对齐问题。
为什么需要字节对齐?计算机组成原理教导我们这样有助于加快计算机的取数速度,否则就得多花指令周期了。为此,编译器默认会对结构体进行处理(实际上其它地方的数据变量也是如此),让宽度为2的基本数据类型(short等)都位于能被2整除的地址上,让宽度为4的基本数据类型(int等)都位于能被4整除的地址上,依次类推。这样,两个数中间就可能需要加入填充字节,所以整个结构体的sizeof值就增长了。
字节对齐的细节和编译器的实现相关,但一般而言,满足三个准则:
1) 结构体变量的首地址能够被其最宽基本类型成员的大小所整除。
2) 结构体的每个成员相对于结构体首地址的偏移量(offset)都是成员大小的整数倍,如有需要,编译器会在成员之间加上填充字节(internal adding)。
3) 结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要,编译器会在最末一个成员后加上填充字节(trailing padding)。
注意:空结构体(不含数据成员)的sizeof值为1。试想一个“不占空间“的变量如何被取地址、两个不同的“空结构体”变量又如何得以区分呢,于是,“空结构体”变量也得被存储,这样编译器也就只能为其分配一个字节的空间用于占位了。
struct S1
{
char a;
int b;
};
sizeof(S1); //值为8,字节对齐,在char之后会填充3个字节。
struct S2
{
int b;
char a;
};
sizeof(S2); //值为8,字节对齐,在char之后会填充3个字节。
struct S3
{
};
sizeof(S3); //值为1,空结构体也占内存
3. 联合体的sizeof
结构体在内存组织上市顺序式的,联合体则是重叠式,各成员共享一段内存;所以整个联合体的sizeof也就是每个成员sizeof的最大值。
union u
{
int a;
float b;
double c;
char d;
};
sizeof(u); //值为8
4. 数组的sizeof
数组的sizeof值等于数组所占用的内存字节数。
注意:1)当字符数组表示字符串时,其sizeof值将’/0’计算进去。
2)当数组为形参时,其sizeof值相当于指针的sizeof值。
char a[10];
char n[] = "abc";
cout<<"char a[10] "<<sizeof(a)<<endl;//数组,值为10
cout<<"char n[] = /"abc/" "<<sizeof(n)<<endl;//字符串数组,将'/0'计算进去,值为4
void func(char a[3])
{
int c = sizeof(a); //c = 4,因为这里a不在是数组类型,而是指针,相当于char *a。
}
void funcN(char b[])
{
int cN = sizeof(b); //cN = 4,理由同上。
}
5. 指针的sizeof
指针是用来记录另一个对象的地址,所以指针的内存大小当然就等于计算机内部地址总线的宽度。
在32位计算机中,一个指针变量的返回值必定是4。
指针变量的sizeof值与指针所指的对象没有任何关系。
char *b = "helloworld";
char *c[10];
double *d;
int **e;
void (*pf)();
cout<<"char *b = /"helloworld/" "<<sizeof(b)<<endl;//指针指向字符串,值为4
cout<<"char *b "<<sizeof(*b)<<endl; //指针指向字符,值为1
cout<<"double *d "<<sizeof(d)<<endl;//指针,值为4
cout<<"double *d "<<sizeof(*d)<<endl;//指针指向浮点数,值为8
cout<<"int **e "<<sizeof(e)<<endl;//指针指向指针,值为4
cout<<"char *c[10] "<<sizeof(c)<<endl;//指针数组,值为40
cout<<"void (*pf)(); "<<sizeof(pf)<<endl;//函数指针,值为4
6. 函数的sizeof
sizeof也可对一个函数调用求值,其结果是函数返回值类型的大小,函数并不会被调用。
对函数求值的形式:sizeof(函数名(实参表))
注意:1)不可以对返回值类型为空的函数求值。
2)不可以对函数名求值。
3)对有参数的函数,在用sizeof时,须写上实参表。
例子:
#include <iostream>
using namespace std;
float FuncP(int a, float b)
{
return a + b;
}
int FuncNP()
{
return 3;
}
void Func()
{
}
int main()
{
cout<<sizeof(FuncP(3, 0.4))<<endl; //OK,值为4,sizeof(FuncP(3,0.4))相当于sizeof(float)
cout<<sizeof(FuncNP())<<endl; //OK,值为4,sizeof(FuncNP())相当于sizeof(int)
/*cout<<sizeof(Func())<<endl; //error,sizeof不能对返回值为空类型的函数求值*/
/*cout<<sizeof(FuncNP)<<endl; //error,sizeof不能对函数名求值*/
return 0;
}
7、类的sizeof()
决定C ++中对象的大小的因素:
1.所有非静态数据成员的大小 |
2.数据成员的顺序 |
3.字节对齐或字节填充 |
4.其直接基类的大小虚函数的存在 |
5. 正在使用的编译器 |
6.继承模式(虚拟继承) |
首先,来看看一个只有构造函数和析构函数的空类:
#include <iostream>
using namespace std;
class Base
{
public:
Base();
~Base();
};
int main(int argc, char *argv[])
{
cout << sizeof(Base) << endl;
}
输出结果为:1
因为一个空类也要实例化,所谓类的实例化就是在内存中分配一块地址,每个实例在内存中都有独一无二的地址。同样空类也会被实例化,所以编译器会给空类隐含的添加一个字节,这样空类实例化之后就有了独一无二的地址了。所以空类的sizeof为1。 而析构函数,跟构造函数这些成员函数,是跟sizeof无关的,也不难理解因为我们的sizeof是针对实例,而普通成员函数,是针对类体的,一个类的成员函数,多个实例也共用相同的函数指针,所以自然不能归为实例的大小。
如果给这个类添加成员变量,最后输出的大小就是这些成员变量的大小之和(这里涉及到一个成员对齐问题,不再叙述了)。
关于类中的字节对齐和字节填充请看:https://blog.youkuaiyun.com/obsorb_knowledge/article/details/106073474
请看一下字节对齐和字节填充的例子:
class C {
char c;
int int1;
int int2;
int i;
long l;
short s;
};
分析:
这个类的大小是24字节。尽管char c只消耗1个字节,但将为它分配4个字节,剩下的3个字节将被浪费(留空)。这是因为下一个成员是int,它占用4个字节。如果我们不进入下一个(4)字节来存储这个整数成员,那么这个整数的内存访问/修改周期将是2个读周期。所以编译器会为我们做这个补位。
图解:
接下来再来看一个有继承的例子:
#include <iostream>
using namespace std;
class Base
{
public:
Base();
~Base();
void set_num(int num) //普通成员函数
{
a=num;
}
private:
int a; //占4字节
char *p; //4字节指针
};
class Derive:public Base
{
public:
Derive():Base(){};
~Derive(){};
private:
static int st; //非实例独占
int d; //占4字节
};
int main(int argc, char *argv[])
{
cout<<sizeof(Base)<<endl;
cout<<sizeof(Derive)<<endl;
return 0;
}
输出结果为:8 12
结果很显然, Base 类按4字节对齐,所以是8个字节,Derive 类中不但继承了Base 类的两个成员变量,还多了两个成员变量,但大小却只有12字节,可以得出:静态变量在计算时是不做考虑的。
上面的例子中都没有涉及到虚函数,下面看个有虚函数的例子:
#include <iostream>
using namespace std;
class Base
{
public:
Base() {}
virtual ~Base() {}
};
int main(int argc, char *argv[])
{
cout << sizeof(Base) << endl;
return 0;
}
输出结果为:4
和第一个程序相比,这个类中,析构函数变成了虚函数,类的大小也变成了4字节,这是因为有了虚函数,编译器就会为类创建一个虚函数表(vtable),并创建一个指针(vptr)指向这个虚函数表。所以类大小变为4字节。如果在 Base 类中再添加新的虚函数,该类的大小还是不会变,因为指向虚函数的指针是放在虚函数表中的,指向虚函数表的指针不会变。
如果在这个类中添加数据成员,就会在4字节的基础上对象大小。
下面再来看看虚函数的继承问题:
#include <iostream>
using namespace std;
class Base
{
public:
Base();
virtual ~Base();
void set_num(int num) //普通成员函数
{
a=num;
}
private:
int a; //占4字节
char *p; //4字节指针
};
class Derive:public Base
{
public:
Derive():Base(){};
~Derive(){};
virtual void foo() { }
private:
static int st; //非实例独占
int d; //占4字节
};
int main(int argc, char *argv[])
{
cout<<sizeof(Base)<<endl;
cout<<sizeof(Derive)<<endl;
return 0;
}
输出结果为:12 16
Base类的大小为12字节很显然,Derive 类中,虽然有一个虚函数 foo ,但是因为它是从Base 类继承的,所以也继承了其虚函数表,并没有创新新的虚函数表,只是在继承下来的表中添加了一项,所以大小为16字节。
再来看看一个虚继承的例子:
#include <iostream>
using namespace std;
class Base
{
public:
Base();
virtual ~Base();
void set_num(int num) //普通成员函数
{
a=num;
}
private:
int a; //占4字节
char *p; //4字节指针
};
class Derive:virtual public Base
{
public:
Derive():Base(){};
~Derive(){};
virtual void foo() { }
private:
static int st; //非实例独占
int d; //占4字节
};
int main(int argc, char *argv[])
{
cout<<sizeof(Base)<<endl;
cout<<sizeof(Derive)<<endl;
return 0;
}
输出结果为:12 20
这里由于虚继承而引入了一个间接的指针(vbc),该指针是指向虚函数表的一个slot,表中存放着该slot中存放虚基类子对象的偏移量的负值。所以大小比之前多了4字节。就算同时虚继承自两个类,也只会有一个这样的间接指针,也就是大小也只多4字节。
说到这里,关于类对象大小问题的计算应该差不多了