sizeof操作符用法终极总结

本文详细解释了C/C++中sizeof运算符的功能及其使用场景,包括与strlen的区别、不同类型及结构体的处理方式,并探讨了对齐问题对结构体大小的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sizeof()功能:计算数据占用内存的字节数
1.
strlen()比较

strlen()
只计算字符数组的字符数,以"\0"为结束判断,但计算的字符长度不包括'\0'
sizeof计算数据(包括数组、变量、类型、结构体等)所占内存空间包括结尾符’\0’的长度在内,用字节数表示。
2.
指针与静态数组的sizeof操作
指针均可看为变量类型的一种。所有指针变量的sizeof操作结果均为4
注意int *p;sizeof(p)=4; //p是指针变量,所有指针变量的sizeof操作结果均为4
sizeof(*p)相当于sizeof(int)结果也是4;      
对于静态数组,sizeof可直接计算数组大小
例:int a[10];

char b[]="hello";

sizeof(a)等于4*10=40; //特别注意这里是40不是其它的

sizeof(b)等于6;

注意数组做型参时,数组名称当作指针使用!!
               void fun(char p[])
               {
sizeof(p)等于4}

经典问题: 
      double* (*a)[3][6]; 
      cout<<sizeof(a)<<endl; // 4 a为指针变量
      cout<<sizeof(*a)<<endl; //72 *a为一个有3*6个指针元素的数组
      cout<<sizeof(**a)<<endl; //24 **a为数组一维的6个指针
      cout<<sizeof(***a)<<endl; //4 ***a为一维的第一个指针
      cout<<sizeof(****a)<<endl; //8 ****a为一个double变量

问题解析:

a是一个很奇怪的定义,它表示一个指向double*[3][6]类型数组的指针。既然是指针,所以sizeof(a)就是4。

既然a是执行double*[3][6]类型的指针,*a就表示一个double*[3][6]的多维数组类型,这个多维数组中的元素存放的是double类型的指针元素,因此sizeof(*a)=3*6*sizeof(double*)=72。  同样,**a表示一个double*[6]类型的数组,所以sizeof(**a)=6*sizeof  (double*)=24。***a就表示其中的一个元素,也就是double*了,所以sizeof(***a)=4。至于****a,就是一个double了,所以sizeof(****a)=sizeof(double)=8。 
3.格式的写法
sizeof操作符
,对变量或对象可以不加括号,但若是类型,须加括号
4.使用sizeofstring的注意事项
   string s="hello";
   sizeof(s)
等于string类的大小,strlen(s.c_str())得到的才是字符串长度

c++编程之字符串的sizeof和strlen


考虑下面的问题:

char a[] ="abcdef";

char b20 = "abcdef";

string s = "abcdef";

cout<<strlen(a)<<endl; // 6,字符串长度

cout<<sizeof(a)<<endl; // 7,字符串容量

cout<<strlen(b)<<endl; // 6,字符串长度

cout<<strlen(b)<<endl; // 20,字符串容量

cout<<sizeof(s)<<endl; //12, 这里不代表字符串的长度,而是string类的大小

cout<<strlen(s)<<endl; // 错误!s不是一个字符指针。

a1 = '\0';

cout<<strlen(a)<<endl; // 1

cout<<sizeof(a)<<endl; // 7sizeof是恒定的

strlen是寻找从指定地址开始,到出现的第一个0之间字符个数,它是在运行阶段执行的,而sizeof是得到数据的大小,在这里是得到字符串的容量。所以对同一个对象而言,sizeof的值是恒定的stringC++类型的字符串,它是一个类所以sizeof(s)表示的并不是字符串的长度,而是类string的大小strlen(s)根本就是错误的因为strlen参数是一个字符指针,如果想用strlen得到s字符串的长度,应该使用strlen(s.c_str()),因为string的成员函数c_str()返回的是字符串的首地址。实际上,string类提供了自己的成员函数来得到字符串的容量和长度,分别是Capacity()Length()string封装了常用了字符串操作,所以在C++开发过程中,最好使用string代替C类型的字符串。


5.union 与struct的空间计算
总体上遵循两个原则:

1.    整体空间是占用空间最大的成员(的类型)所占字节数的整倍数

2.    数据对齐原则----内存按结构成员的先后顺序排列当排到该成员变量时,其前面摆放的空间大小必须是该成员类型大小的整倍数,如果不够则补齐以此向后类推……

注意:数组按照单个变量一个一个的摆放,而不是看成整体。如果成员中有自定义的类、结构体,也要注意数组问题。
例:因为对齐问题使结构体的sizeof变得比较复杂,看下面的例子:(默认对齐方式下)
struct s1
{
char a;
double b;
int c;
char d; 
};
struct s2
{
char a;
char b;
int c;
double d;

};
cout<<sizeof(s1)<<endl; //24
cout<<sizeof(s2)<<endl; // 16

同样是两个char类型,一个int类型,一个double类型,但是因为对齐问题,导致他们的大小不同。计算结构体大小可以采用元素摆放法,我举例子说明一下:首先,CPU判断结构体的对界,根据上一节的结论,s1和s2的对界都取最大的元素类型,也就是double类型的对界8。然后开始摆放每个元素。

 对于s1,首先把a放到8的对界,假定是0,此时下一个空闲的地址是1,但是下一个元素d是double类型,要放到8的对界上,离1最接近的地址是8了,所以d被放在了8,此时下一个空闲地址变成了16,下一个元素c的对界是4,16可以满足,所以c放在了16,此时下一个空闲地址变成了20,下一个元素d需要对界1,也正好落在对界上,所以d放在了20,结构体在地址21处结束。由于s1的大小需要是8的倍数,所以21-23的空间被保留,s1的大小变成了24。

对于s2,首先把a放到8的对界,假定是0,此时下一个空闲地址是1,下一个元素的对界也是1,所以b摆放在1,下一个空闲地址变成了2;下一个元素c的对界是4,所以取离2最近的地址4摆放c,下一个空闲地址变成了8,下一个元素d的对界是8,所以d摆放在8,所有元素摆放完毕,结构体在15处结束,占用总空间为16,正好是8的倍数。
  这里有个陷阱,对于结构体中的结构体成员,不要认为它的对齐方式就是它的大小,看下面的例子:
struct s1
{
char a[8];
};
struct s2
{
double d;
};
struct s3
{
s1 s;
char a;
};
struct s4
{
s2 s;
char a; 
};
cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;

s1和s2大小虽然都是8,但是s1的对齐方式是1,s2是8(double),所以在s3和s4中才有这样的差异。
  所以,在自己定义结构体的时候,如果空间紧张的话,最好考虑对齐因素来排列结构体里的元素。

补充不要让double干扰你的位域 

结构体中,可以使用位域来规定某个成员所能占用的空间,所以使用位域能在一定程度上节省结构体占用的空间。不过考虑下面的代码: 
struct s1 

int i: 8; 
int j: 4; 
double b; 
int a:3; 
}; 
struct s2 

int i; 
int j; 
double b; 
int a; 
}; 
struct s3 

int i; 
int j; 
int a; 
double b; 

}; 
struct s4 

int i: 8; 
int j: 4; 
int a:3; 
double b;
 
}; 
cout<<sizeof(s1)<<endl; //24 
cout<<sizeof(s2)<<endl; // 24 
cout<<sizeof(s3)<<endl; // 24 
cout<<sizeof(s4)<<endl; // 16 

可以看到,有double存在会干涉到位域,所以使用位域的的时候,最好把float类型和double类型放在程序的开始或者最后,就能发挥位域的真正作用:压缩存储空间

有关C /C++位域的深入理解,请看我的另一篇博文:深入理解C/C++的位域结构体

相关常数: 

sizeof int:4
sizeof short:2
sizeof long:4
sizeof float:4
sizeof double:8
sizeof char:1
sizeof ptr:4
sizeof WORD:2
sizeof DWORD:4


<think>我们正在讨论动态分配的字符串(在堆上分配)如何正确使用sizeof和strlen。 首先回顾: - sizeof是运算符,在编译时确定,返回的是类型或对象所占内存的字节数(包括填充字节)。 - strlen是函数,在运行时确定,计算从给定指针开始直到遇到第一个空字符('\0')之前的字符个数(不包括'\0')。 对于动态分配的字符串,我们通常使用指针来管理,例如: char* str = new char[100]; // 动态分配一个可以容纳100个字符的数组 注意:动态分配的字符串数组,本质上是一个字符数组,但作为指针来使用。 关键点: 1. 使用sizeof对动态分配的字符串指针(即char*)进行操作,得到的是指针本身的大小,而不是指针指向的内存块的大小。 例如,在64位系统中,sizeof(char*)通常是8字节(与具体系统相关)。 2. 使用strlen对动态分配的字符串进行操作,可以正确得到字符串的长度(即从开始到第一个'\0'的字符数),但前提是字符串必须以'\0'结尾,且中间不能有'\0'。 3. 动态分配的内存块大小(例如100)在编译时对sizeof是未知的,因为sizeof在编译时求值,而动态分配的大小是在运行时确定的。 因此,我们不能使用sizeof来获取动态分配的字符串数组的长度(即分配的内存块大小),除非我们额外记录这个大小。 示例代码: ```cpp #include <iostream> #include <cstring> using namespace std; int main() { // 动态分配一个可以容纳100个字符的数组 char* dynamicStr = new char[100]; // 初始化字符串,复制一个字符串进去(包括结尾的'\0') strcpy(dynamicStr, "Hello, dynamic world!"); // 使用sizeof: 得到的是指针的大小,不是字符串长度也不是分配的内存大小 cout << "Size of pointer (dynamicStr): " << sizeof(dynamicStr) << endl; // 通常是4或8 cout << "Size of the first element: " << sizeof(*dynamicStr) << endl; // 1,因为*dynamicStr是char类型 // 使用strlen: 得到字符串的有效长度(直到第一个'\0') cout << "Length of string by strlen: " << strlen(dynamicStr) << endl; // 注意:我们无法通过sizeof得到分配的内存块大小(100) // 例如,下面的法是错误的: // sizeof(dynamicStr) 返回指针大小,不是数组大小 // sizeof(*dynamicStr) 返回第一个字符的大小(1) // 正确法:我们必须自己记住分配的大小(100) // 因为动态分配时,我们指定了大小,所以应该用一个变量来记录 const int allocatedSize = 100; cout << "Allocated size (known by us): " << allocatedSize << endl; // 使用strlen时要注意:如果字符串中间有'\0',则strlen只计算到第一个'\0'之前 strcpy(dynamicStr, "Hello\0 world"); // 字符串中间有'\0' cout << "String: \"Hello\\0 world\"" << endl; cout << "strlen after embedded null: " << strlen(dynamicStr) << endl; // 输出5 // 释放内存 delete[] dynamicStr; return 0; } ``` 输出示例(64位系统): ``` Size of pointer (dynamicStr): 8 Size of the first element: 1 Length of string by strlen: 22 Allocated size (known by us): 100 String: "Hello\0 world" strlen after embedded null: 5 ``` 总结: - 对于动态分配的字符串,使用`strlen`可以获取字符串的实际长度(即字符个数,直到第一个`\0`),但前提是字符串必须正确以`\0`结尾(C风格字符串)。 - 使用`sizeof`对动态分配的字符串指针操作,只能得到指针的大小,而不是分配的内存大小。要获取分配的内存大小,必须由程序员自己记录(因为分配时指定了大小)。 - 动态分配的字符串数组在分配时指定了大小,但`strlen`并不关心分配的大小,它只关心内容直到`\0`。因此,使用`strcpy`等函数时,必须确保不会超出分配的内存大小,否则会导致缓冲区溢出。 建议: - 在C++中,更推荐使用`std::string`来管理动态字符串,它封装了内存管理,可以通过`size()`或`length()`成员函数获取字符串长度,而不需要担心内存分配大小和结束符。 - 如果必须使用动态字符数组,那么应该始终记录分配的大小,并在操作时确保不超过这个大小。 引用说明: - 引用[2]中提到:`sizeof`操作符以字节形式给出了其操作数的存储大小,为一种单目运算符;`strlen`返回第一次遇到`\0`结束符的长度(不包括`\0`)。在动态分配的字符串中,对指针使用`sizeof`得到指针大小,对数组内容(第一个元素)使用`sizeof`得到单个字符的大小(1字节)[^2]。 - 引用[3]中提到:字符串都会隐藏一个“\0”作为结束标志,`sizeof`会统计这个“\0”,而`strlen`不会。但在动态分配的字符数组中,`sizeof`无法直接得到整个数组的大小(因为数组名已经退化为指针)[^3]。 相关问题: 1. 为什么动态分配的内存大小无法通过`sizeof`获取? 2. 在C++中,如何安全地获取动态分配字符数组的分配大小? 3. 使用`strlen`处理动态分配的字符串时有哪些风险?如何避免? 4. 对比`std::string`和动态字符数组在长度获取上的区别。</think>### C++ 动态分配字符串中 `sizeof` 和 `strlen` 的区别与正确使用 #### 🔑 核心区别 | **特性** | **`sizeof`** | **`strlen`** | |----------------|---------------------------------------|---------------------------------------| | **操作对象** | 指针本身或单个元素 | 字符串内容(需以 `\0` 结尾) | | **返回值** | 指针大小或元素类型大小 | 字符串实际字符数(不含 `\0`) | | **动态内存** | 无法获取分配的内存块大小 | 可获取字符串内容长度 | | **依赖数据** | 编译时确定,与内容无关 | 运行时遍历,依赖 `\0` 终止符 | | **安全风险** | 无风险 | 若缺少 `\0` 会导致越界访问 | --- #### 💻 正确使用示例 ```cpp #include <iostream> #include <cstring> using namespace std; int main() { // 动态分配字符串 char* dynStr = new char[100]; strcpy(dynStr, "Dynamic C++"); // 包含隐含的 '\0' // ✅ 正确用法 cout << "1. strlen(dynStr) = " << strlen(dynStr) // 返回字符串长度: 10 << "\n2. sizeof(dynStr) = " << sizeof(dynStr) // 返回指针大小: 8 (64位系统) << "\n3. sizeof(*dynStr) = " << sizeof(*dynStr); // 返回char大小: 1 // ⚠️ 常见错误示例 // 错误1: 用sizeof获取分配大小(实际返回指针大小) cout << "\n\n❌ sizeof(dynStr) 错误: " << sizeof(dynStr); // 输出8,非100 // 错误2: 未初始化导致strlen越界 char* dangerStr = new char[10]; // 未设置终止符,strlen可能越界! // cout << strlen(dangerStr); // 未定义行为! // 正确释放 delete[] dynStr; delete[] dangerStr; return 0; } ``` **输出**: ``` 1. strlen(dynStr) = 10 2. sizeof(dynStr) = 8 3. sizeof(*dynStr) = 1 ❌ sizeof(dynStr) 错误: 8 ``` --- #### 📌 关键结论 1. **`strlen` 用于内容长度** - 仅适用于 **已初始化** 且 **以 `\0` 结尾** 的字符串 - 返回实际字符数(不含 `\0`) - 示例:`strlen(dynStr)` → 10 2. **`sizeof` 用于类型/指针大小** - 对指针:返回指针存储大小(64位系统通常为8字节) - 对元素:`sizeof(*ptr)` 返回元素类型大小(`char` 为1字节) - **无法获取分配的内存块大小**[^2][^3] 3. **动态内存大小的管理** ```cpp // ✅ 必须手动记录分配大小 const size_t BUFFER_SIZE = 100; char* buffer = new char[BUFFER_SIZE]; // ❌ sizeof无法获取BUFFER_SIZE cout << sizeof(buffer); // 错误!输出8而非100 ``` --- #### ⚠️ 风险与解决方案 | **场景** | **风险** | **解决方案** | |-------------------------|--------------------------|---------------------------------------| | 未初始化的动态字符串 | `strlen` 越界访问 | 初始化:`memset(ptr, 0, size)` | | 缺少 `\0` 终止符 | `strlen` 无限循环 | 确保字符串以 `\0` 结尾 | | 需要获取分配的内存大小 | `sizeof` 无法实现 | 手动记录分配大小变量 | | 指针与数组混淆 | `sizeof` 返回指针大小 | 使用 `std::vector` 或 `std::string` | > 📌 最佳实践:优先使用 `std::string`,避免手动管理: > ```cpp > #include <string> > std::string s = "Safe and flexible"; > cout << s.size(); // 返回17(含空格) > cout << s.length(); // 同size() > ``` --- #### 💎 总结 1. **`strlen`** → **字符串内容长度**(需以 `\0` 结尾) 2. **`sizeof`** → **指针/元素类型大小**(编译时确定) 3. **动态分配大小** → **必须手动记录**(`sizeof` 无法获取)[^2][^3] 4. **终极方案** → 使用 `std::string` 自动管理内存和长度 --- ### 相关问题 1. 为什么动态分配的字符数组使用 `sizeof` 无法返回实际分配大小? 2. 如何安全初始化动态分配的字符串以避免 `strlen` 越界? 3. `std::string` 的 `size()` 和 `length()` 与 `strlen` 有何区别? 4. 在C++中如何正确实现动态字符串的长度跟踪机制?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值